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“统计 学 是 什么 ”” 早 在 1838 年 就 有 人 提出 过 这 个 问题 〈 与 英国 
星 家 统计 学 会 有 关 ), 此 后 这 个 问题 又 被 反复 提起 。 多 年 来 , 铁 打 的 问 
题 和 流水 的 答案 已 成 为 该 讨论 的 特点 。 综 合 问题 和 答案 可 以 看 出 ， 持 
续 的 疑问 源 于 ， 统 计 学 并 不 是 一 个 单一 学 科 。 自 诞生 至 今 ， 统 计 学 的 
工作 内 容 经 历 了 翻天 履 地 的 变化 : 从 极端 强调 “统计 学 家 仪 收集 数据 
而 不 分 析 ” ,转变 为 从 计划 到 分 析 的 所 有 研究 阶段 丝 积 极 寻 求 与 科学 家 
的 合作 。 并 且 ， 统 计 学 工作 者 面 对 不 同 的 科学 领域 时 ， 需 要 相应 调整 
自身 角色 : 在 某 些 应 用 中 ， 我 们 接受 基于 数学 理论 推导 的 科学 模型 ; 
而 某 些 应 用 中 ， 我 们 构建 如 牛顿 力学 体系 一 样 稳定 的 模型 。 在 一 些 应 
用 中 ,我 们 既是 积极 的 计划 者 ， 又 是 消极 的 分 析 师 ; 而 在 男 一 些 应 用 
中 ， 我 们 的 角色 则 恰恰 相反 。 统 计 学 工作 者 除了 角色 众多 ， 还 需要 为 
了 避免 失误 、 保 持 角色 平衡 而 面 对 种 种 挑 成 。 这 就 难怪 “统计 学 是 什 
么 ”的 老 问题 , 无论 面 对 哪个 时 代 的 新 挑战 ， 总 会 被 重复 提起 。 "统计 
学 的 挑战 ”在 19 世纪 30 年 代 指 经 济 统计 ， 在 20 世纪 30 年 代 指 生物 
问题 ， 而 目前 指定 义 模糊 的 “大 数据 ”问题 。 

统计 学 有 各 种 各 样 的 问题 、 方 法 和 解释 ， 那 到 底 有 没有 自己 的 核 
心 科学 呢 ? 如 果 统 计 学 工作 者 总 是 致力 于 在 诸多 科学 领域 工作 一 一 从 
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公共 政策 到 验证 希 格 斯 玻 色 子 的 发 现 一 一 甚至 有 时 候 只 被 视 为 服务 人 
员 ， 那 统计 学 还 能 真正 合理 地 被 大 家 视 为 统一 的 学 科 吗 ? 它 能 被 视 为 
我 们 统计 学 工作 者 自己 的 科学 吗 ? 这 个 问题 就 是 我 想 在 本 书 中 解决 
的 。 我 不 打算 告诉 你 统计 学 是 什么 或 不 是 什么 ， 而 是 尝试 制定 七 个 原 
则 ， 即 支撑 统计 学 领域 的 七 根 支 柱 。 它 们 在 过 去 曾 以 不 同方 式 支 撑 统 
计 学 ， 我 保证 ， 它 们 一 定 还 会 在 无 限 的 未 来 继续 起 到 这 样 的 作用 。 我 
会 尽力 使 你 相信 ， 每 根 支柱 的 引入 都 是 革命 性 的 ， 并 对 统计 学 的 发 展 
产生 了 深远 影响 。 

本 书 书 名 借鉴 了 托马斯 . 劳伦斯 ( 即 阿拉 伯 的 劳伦斯 ) 完成 于 
1926 年 的 回忆 录 《 智 慧 七 柱 交 这 部 回忆 录 的 名 称 源 于 《 旧 约 … f&ui ). 
(GREIS 写 道 : “智慧 建造 了 房 舍 , 雕琢 了 七 根 支 柱 。 Hed Ced). 
建造 智慧 的 房屋 是 为 了 欢迎 寻求 知识 的 人 。 此 外 , 本 书 还 有 一 个 目的 : 
阐释 统计 推理 的 核心 思想 。 

将 这 七 个 原则 称 作 “统计 学 的 七 大 支柱 ”之 前 ， 我 先 强 调 ， 它 们 
是 七 根 “ 支 撑 ” 的 柱子 ， 是 统计 学 的 学 科 基 础 ， 而 不 是 完整 的 体系 。 
一 方面 ， 这 七 根 支 柱 都 有 古老 的 起 源 ; 另 一 方面 ， 现 代 学 科 通 过 自身 
结构 的 伟大 独创 性 ， 以 及 华丽 承诺 不 断 产 生 的 精彩 的 新 思想 ， 将 统计 
学 构建 为 多 元 化 的 科学 。 在 不 脱离 现代 工作 的 前 提 下 ， 我 希望 在 统计 
学 核心 中 建立 跨 时 代 和 跨 应 用 领域 的 连接 和 统一 。 

第 一 根 支柱 称 为 聚合 ( Aggregation )。 我 们 也 可 以 使 用 它 在 19 t 
纪 的 名 称 “ 观 测 的 组 合 ", 其 至 使 用 最 简化 的 名 称 : 均值 。 名 字 太 简单 
可 能 误导 读者 ， 其 实 ， 虽 然 它 现 在 看 来 已 不 新 鲜 ， 但 在 早年 却 真正 地 
具有 革命 性 ， 并 且 时 至 今日 依然 如 此 一 一 无 论 它 在 何 时 进入 新 的 应 用 
领域 。 那 么 ， 它 如 何 体现 革命 性 ? 按照 规定 ， 给 定 一 些 观 测 值 ， 你 可 
以 通过 丢弃 信息 而 真正 获得 信息 ! 我 们 对 观测 值 取 简单 的 算术 平均 值 ， 
丢弃 观测 值 的 个 别 特征 ， 而 将 其 都 纳入 汇总 值 进行 考虑 。 目 前 ， 这 在 
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重复 测量 中 很 常见 ， 比 如 观测 恒星 在 太空 中 的 位 置 。 然 而 在 17 世纪 ， 
可 能 需要 忽略 这 样 一 些 信息 ， 比 如 法 国 是 个 酒鬼 观测 员 做 出 的 观测 , 
俄罗斯 人 是 用 旧 仪器 做 出 的 观测 ， 英 国 是 个 很 靠 谱 的 朋友 做 的 观测 。 
事实 上 ， 抹 去 个 体 观测 的 细节 比 任何 单个 观测 都 能 给 出 更 棒 的 指示 。 
根据 记录 , 算术 平均 值 的 使 用 最 早出 现在 1635 年 ; 而 其 他 形式 的 
统计 汇总 的 历史 则 更 为 悠久 ， 可 以 追溯 到 美 索 不 达 米 亚 文 明 最 初出 现 
文字 的 时 代 。 当 然 ， 第 一 根 支 柱 最 近 的 重要 实例 更 为 复杂 。 最 小 二 乘 
法 及 其 衍生 方法 的 本 质 都 是 均值 ， 它 们 通过 对 数据 进行 加 权 汇 总 而 抹 
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去 
代 平 滑 器 在 本 质 上 也 是 均值 。 

第 二 根 支 柱 叫 作 信息 ( Information )， 更 具体 地 说 是 “信息 度量 ”， 
也 是 说 来 话 长 又 很 有 意思 。 我 们 什么 时 候 有 足够 的 证 据 证 明 一 Rast 
的 疗效 ? 这 个 问题 可 以 追溯 到 十 和 希腊。 而 研究 信息 积累 率 的 时 代 则 要 
近 很 多 。18 世纪 早期 ， 人 们 发 现在 很 多 情况 下 ， 一 个 数据 集 的 信息 量 
仪 与 观测 个 数 n 的 平方 根 成 正比 ， 而 不 与 n 本 身 成 正比 。 这 也 是 革命 
性 的 思想 。 假 设 你 试图 说 服 一 名 宇航 员 ， 如 果 他 想 将 研究 精度 提高 一 
倍 , 那么 他 需要 用 4 倍数 目的 观测 ; 又 或 者 , 第 二 组 20 个 观测 值 与 前 
20 个 观测 值 尽管 同样 精确 ， oe le tk 
Ko 我 们 将 这 个 思想 称 为 “ 根 号 nn 规则”。 要 一 些 很 强 的 假设 , 并 
PAE OE Rm 1900 年 就 明确 建 
立 了 这 样 的 思想 : 数据 中 的 信息 可 以 测量 ， 而 测量 的 精度 与 数据 量 有 
关 ， 某 些 情形 下 可 以 精确 刻画 相关 性 的 形式 。 

我 将 第 三 根 支柱 命名 为 似 然 (Likelihood )， 意 味 着 使 用 了 概率 的 
推理 的 校准 。 显 著 性 检验 和 普通 的 P 值 都 是 最 简单 的 似 然 形式 ， 但 诚 
如 其 名 ,与 “ 似 然 ” 有 关 的 方法 丰富 多 彩 ， 其 中 许多 方法 或 者 与 费 使 
尔 推断 的 参数 族 有 关 ， 或 者 与 贝 叶 斯 推断 的 参数 族 有 关 。 各 种 各 样 的 
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检验 可 以 追溯 到 至 少 一 千年 前 ， 但 最 早 使 用 概率 的 检验 则 出 现在 18 
世纪 早期 。 许 多 例子 出 现在 18 世纪 ~19 世纪 ， 而 系统 性 处 理 则 出 现在 
20 世纪 罗 纳 德 ， 费 舍 尔 的 工作 ， 以 及 耶 日 . 奈 曼 和 伊 冈 . 皮尔 逊 的 工 
作 中 。 从 那 时 起 ， 统 计 学 家 开始 认真 发 展 了 一 整套 似 然 理论 。 人 们 最 
熟悉 的 检验 可 能 是 用 概率 校准 推断 ， 但 一 个 概率 数字 无 论 作为 置信 区 
间 还 是 贝 叶 斯 后 验 概 率 ， 都 必须 完全 附属 于 一 种 推断 。 事 实 上 ，250 
年 前 发 表 的 “托马斯 ， 贝 叶 斯 定理 ”就 是 为 了 完成 这 个 目标 。 

第 四 根 支柱 的 名 字 是 相互 比较 ( Intercomparison )。 这 个 名 称 借鉴 
了 弗朗西斯 : 高 尔 顿 的 一 篇 论文 ， 它 表达 了 一 个 过 去 激进 但 现在 普通 
的 思想 : 统计 比较 常常 可 以 采用 数据 自身 的 内 部 标准 ， 而 不 必 采 用 外 
部 标准 。 相 互 比较 最 常见 的 例子 是 学 生 t 检验 和 方差 分 析 的 检验 。 一 
方面 ， 在 复杂 设计 中 ， 变 化 的 划分 可 能 错综复杂 ; 另 一 方面 ， 复 杂 设 
计 人 允许 区 组 设计 、 裂 区 设计 ， 或 完全 根据 手头 数据 评价 的 层次 设计 。 
这 种 思想 非常 激进 ， 而 且 在 “有 效 ” 的 检验 中 ， 这 种 思想 有 着 与 最 强 
大 的 工具 一 样 的 问题 : 可 能 由 于 忽略 外 部 科学 标准 而 导致 错误 方式 的 
滥用 。 我 们 可 以 将 自助 法 视 为 相互 比较 在 假设 弱化 后 的 现代 版 本 。 

第 五 根 支柱 叫 作 回归 (Regression )。 这 个 名 称 源 于 高 尔 顿 1885 
年 发 表 的 论文 ， 这 份 文献 基于 二 元 正 态 分 布 解释 了 什么 是 回归 。 达 和 尔 
文 的 自然 选择 理论 存在 内 部 矛盾 : 选择 需要 增加 多 样 性 ， 但 定义 物种 
需要 群体 外 观 稳定 。 高 尔 顿 尝试 为 这 个 理论 设计 一 个 数学 框架 ， 并 成 
功 地 克服 了 这 组 矛盾 。 

回归 现象 可 简单 解释 为 : 假设 有 两 个 不 完全 相关 的 观测 变量 ， 你 
选择 了 其 中 极 值 远离 均值 的 变量 ， 那 么 可 以 预期 另 一 个 〈 以 标准 差 为 
单位 ) 不 会 那么 极端 。 高 个 子 的 父母 平均 会 孕育 身高 稍 矮 的 子女 ， 而 
高 个 子 的 子女 平均 会 有 身高 稍 矮 的 父母 。 但 这 一 现象 涉及 的 不 只 是 一 
个 简单 的 悖 论 : 真正 新 奇 的 思想 在 于 ， 提 问 的 方式 不 同 ， 答 案 就 完全 
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不 同 。 事 实 上 ， 这 项 工作 引入 了 现代 多 元 分 析 和 任何 推断 理论 都 需要 
的 工具 。 引 入 这 个 条 件 分 布 的 工具 前 ， 真 正 一 般 化 的 贝 叶 斯 定理 无 法 
使 用 。 因 此 , 这 根 支 柱 与 因果 、 推 断 一 样 , 是 贝 叶 斯 学 派 的 核心 内 容 。 

第 六 根 支 柱 是 设计 (Design )。 类 似 于 在 “实验 设计 ”中 的 含义 ， 
但 “设计 ”的 范围 更 广泛 ， 它 的 目标 是 : 先 设 定 观 测 的 权重 相同 ， 再 
训练 我 们 的 思想 。 设 计 的 某 些 要 素 历 史 悠 入,《 旧 约 全 书 》 和 早期 的 阿 
拉 伯 医学 提供 了 相应 的 例子 。 从 19 世纪 晚期 ， 随 着 查尔斯 皮尔 斯 和 
费 舍 尔 先 后 发 现 随机 化 在 推断 中 的 巨大 作用 ， 统 计 学 出 现 了 对 设计 主 
题 的 新 理解 。 费 舍 尔 认识 到 结合 严谨 的 随机 化 方法 将 会 带 来 好 处 ， 于 
是 在 实验 法 则 中 引入 激进 的 改变 。 这 些 改变 一 反 几 个 世纪 以 来 的 实验 
哲学 和 实践 , 将 这 一 主题 提升 到 了 一 个 新 的 高 度 。 多 因素 现场 试验 中 ， 
费 舍 尔 的 设计 允许 效应 的 分 离 和 相互 作用 的 估计 ; 实施 随机 化 后 ， 有 
效 推断 不 再 需要 正 态 性 或 者 材料 的 均匀 性 的 假设 。 

第 七 根 也 是 最 后 一 根 支 柱 称 为 残 差 ( Residual ) "525" 表示 “其 
他 的 一 切 ” 你 也 许 会 怀疑 这 是 一 种 托 词 , 但 我 想 表 达 一 种 更 具体 的 思 
想 。 从 19 世纪 30 年 代 开 始 ， 有 关 残 差 现象 的 概念 在 关于 逻辑 的 书籍 
中 就 很 常见 。 正如 一 位 作者 所 说 :“ 复 杂 的 现象 …… 可 以 通过 减 去 已 知 
原因 的 影响 进行 简化 …… 留 下 …… 需 要 解释 的 残 差 现 象 。 通 过 这 样 处 
理 …… 科 学 …… 得 到 了 极 大 的 促进 。” 而 后 , 这 种 思想 总 体 上 归 入 古典 
的 范围 ， 却 以 一 种 新 方式 在 统计 学 中 得 到 使 用 。 这 种 新 方式 结合 了 结 
构 化 模型 族 ， 并 通过 概率 计算 和 统计 逻辑 在 族 内 做 选择 ， 从 根本 上 强 
化 和 规范 了 方法 。 模 型 诊断 ( 画 出 残 差 ) 在 统计 学 中 极为 常见 ， 但 通 
过 拟 合 和 比较 伦 套 模型 探索 高 维 空间 的 方法 更 具 重 大 意义 。 每 个 对 回 
归 系 数 显著 性 的 检验 都 体现 了 这 种 思想 ， 针 对 时 间 序 列 的 每 一 个 探索 
亦 是 如 此 。 

我 重新 概括 了 七 根 支柱 ， 用 七 种 基本 统计 思想 的 作用 来 表达 一 一 
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(1) 定向 减少 或 压缩 数据 的 价值 。 
(D 数据 量 上 升 ， 价 值 会 减少 。 
(3) 如 何 使 用 概率 测量 我 们 做 的 事 
(4) 如 何 使 用 数据 中 的 内 部 变化 帮 
(5) 从 不 同 角 度 提问 可 以 产生 有 启 
(6) 规划 观测 的 重要 作用 。 











尽管 这 样 做 也 许 会 导致 过 度 简化 的 风险 。 
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助 分 析 ? 
发 性 的 不 同 答案 。 


(7) 所 有 这 些 思想 如 何 用 于 科学 探索 和 比较 彼此 矛盾 的 解释 。 
但 是 ， 无论 这 些 思想 出 现 于 过 去 还 是 现在 ， 以 上 平淡 的 陈述 都 没 
有 表现 出 这 些 思想 出 现时 的 革命 性 。 在 当时 ,这些 思想 一 一 从 放弃 数 























据 值 的 个 体 特点 到 降低 新 数据 和 等 价值 数据 的 权重 ， 再 到 克服 障碍 使 
用 概率 测量 博弈 外 部 的 不 确定 性 一 一 已 经 丢弃 或 推翻 了 既 有 的 牢固 的 
数学 和 科学 信念 。 世 界 产生 了 数据 ， 那 么 数据 自身 的 变化 如 何 能 够 测 












































量 世 界 的 不 确定 性 ”高 尔 顿 的 多 元 分 析 向 科学 家 揭示 ， 科 学 家 依赖 的 
比例 规则 ( 流传 自 欧 几 里 得 时 代 的 比例 规则 ) 不 适用 于 数据 有 变化 的 
科学 世界 。 这 推翻 了 3000 年 来 的 数学 传统 。 费 舍 尔 的 设计 直接 否定 了 
实验 科学 家 和 逻辑 学 家 几 个 世纪 以 来 深信 的 内 容 ， 他 的 模型 比较 方法 
对 实验 科学 来 说 绝对 新 颖 , 而 接受 这 种 方法 则 需要 几 代 人 的 思维 改变 。 

想 知 道 以 上 所 有 思想 的 革命 性 和 影响 力 有 多 大 吗 ? 只 要 考虑 一 下 
这 些 思想 持续 受到 的 强烈 批评 便 可 知 一 二 。 这 些 批评 常常 攻击 那些 我 

















认为 价值 很 大 的 地 方 ， 列 举 如 下 。 


口 批评 大 数据 仅仅 可 以 回答 那些 3 








口 批评 统计 将 人 视 为 纯粹 的 统计 量 ， 而 忽略 人 作为 个 体 的 特性 。 





队 认 基于 规模 基础 的 问题 。 


口 批评 显著 性 检验 会 忽略 问题 的 科学 内 容 。 
口 批评 回归 分 析 会 忽略 问题 中 更 重要 的 内 容 。 


这 些 批判 本 身 也 有 缺陷 。 虽 然 不 乏 正确 之 人 处， 并且 在 某 些 极端 的 
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例子 中 直击 要 害 ， 但 是 ， 这 些 批判 常常 只 瞄准 方法 ， 而 非 方法 在 例子 
里 的 运用 方式 。1927 4E, 爱德华 . B. 威尔逊 对 此 做 了 一 番 精 彩 的 评论 : 
“就 像 没有 接受 过 工具 训练 的 人 会 害怕 仓库 中 的 任何 一 件 工具 一 样 , 缺 
乏 统计 学 知识 的 人 会 相信 科学 方法 论 中 的 统计 工具 都 非常 危险 。” 

我 将 讲述 这 七 根 支柱 ， 并 简单 介绍 它们 的 历史 。 这 七 根 支柱 都 是 
优秀 的 工具 ， 但 人 们 需要 足够 的 智慧 和 训练 才 可 以 有 效 使 用 它们 。 这 
些 思想 不 是 数学 的 一 部 分 ， 也 不 是 计算 机 科学 的 一 部 分 ， 它 们 是 统计 
学 的 核心 内 容 。 另 外 ,我 现在 需要 承认 ， 虽 然 在 本 书 开 始 直 接 和 否认 了 
我 的 目的 是 解释 统计 学 是 什么 ， 但 到 本 书 结尾 ， 其 实 我 已 经 完成 了 这 
个 目标 。 

现在 ， 我 要 简短 地 回应 一 个 未 了 结 的 问题 :《 艇 言 》9:1 究竟 说 了 
什么 ? 它 是 这 样 一 条 古语 :“ 智 慧 建造 了 房 舍 ， 雕 琢 了 七 根 支 柱 。 ”为 
什么 一 间 房 屋 需要 七 根 柱子 ?” 这 种 结构 无 论 在 古代 还 是 在 当代 似乎 都 
鲜 有 人 知 。 最 近 的 一 项 我 比较 信服 的 研究 表明 , 那些 负责 为 日 内 瓦 " 和 
詹姆斯 王 ” 翻 译 圣 经 的 16 世纪 学 者 们 ， 因 为 不 太 了 解 早 期 的 苏 美 尔 神 
话 ， 错 误 地 翻译 了 这 一 节 。 七 根 支 柱 根本 不 是 建筑 的 结构 ， 而 是 大 洪 
水 之 前 美 索 不 达 米 亚 的 七 个 伟大 王国 。 七 位 智者 向 国王 进 谏 建立 了 七 
个 城市 ， 七 个 王国 正 是 建立 在 这 七 个 城市 基础 之 上 的 。 因 此 ,智慧 的 
房屋 建立 在 这 七 位 智者 的 意见 之 上 。 时 代 更 近 的 学 者 提出 了 新 的 翻译 : 
“智慧 建造 了 房 舍 ,七 位 智者 商定 了 其 基础 。 

正 是 由 于 远 远 多 于 七 位 的 智者 的 不 懈 努 力 ， 我 得 以 将 他 们 的 成 果 
总 结 为 七 根 支 柱 。 其 中 一 些 智 者 的 姓名 已 经 淹没 在 历史 的 长 河 之 中 ， 
在 本 书 的 相关 部 分 ， 我 们 会 读 到 他 们 的 智慧 成 果 。 


~ 







































































































































































(D 指 1570 年 在 日 内 瓦 出 版 的 圣经 译本 。 一 一 译 者 注 
O 英 王 詹姆斯 一 世 下 令 将 圣经 译 为 英文 ， 于 1611 年 出 版 。 一 一 译 者 注 
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扫描 如 下 二 维 码 ， 即 可 购买 本 书 电 子 版 。 
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第 1 章 


聚合 : 从 表格 和 均值 旬 最 小 二 乘 





第 一 根 支柱 一 一 聚合 ,不仅 最 古老 ,也 最 激进 。 在 19 世纪 ， 它 被 
称 为 “观测 的 组 合 "。 这 种 说 法 表达 的 思想 是 : 把 数据 集中 的 个 体 值 进 
行 统计 汇总 ， 概 括 出 的 信息 可 以 超越 个 体 。 统 计 学 的 整体 概括 大 于 各 
部 分 的 加 总 。 样 本 均值 就 是 这 样 一 个 例子 ， 它 是 较 早 就 被 大 家 重视 的 
一 门 技术 , 同样 的 思想 也 反映 在 其 他 一 些 汇 总 指标 上 , 比如 加 权 均 值 ， 
甚至 最 小 二 乘 在 本 质 上 也 是 一 种 基于 个 体 数据 值 的 特征 进行 加 权 或 调 
整 的 平均 值 。 

在 分 析 中 ， 对 数据 以 任何 形式 取 均 值 都 是 一 个 相当 激进 的 步 又 ， 
因为 取 均 值 会 丢弃 数据 中 的 信息 ， 让 每 个 观测 值 失 去 个 性 : 测量 的 顺 
序 和 不 同 的 产生 环境 ,包括 观测 者 的 身份 。1874 年 曾 有 一 次 万 众 有 瞩目 
的 “金星 凌 日 "， 是 1769 年 以 来 的 第 一 次 ， 因 此 许多 国家 都 向 最 佳 观 
测 位 置 派 遗 了 远征 队 。 获 知 凌 日 开始 与 结束 的 确切 时 间 ， 可 以 帮助 精 
准确 定 太阳 系 的 规模 。 不 同城 市 的 观测 人 员 提 供 的 观测 报告 能 相似 到 
使 均值 有 意义 吗 ? 这 些 观 测 是 由 技术 水 平 不 同 的 人 ,使 用 不 同 的 设备 ， 
在 不 同 的 地 点 和 稍 有 不 同 的 凌 日 发 生 时 间 做 出 的 。 就 此 而 言 ， 如 果 单 
个 观测 者 连续 观测 一 颗 恒 星 的 位 置 ， 切 实感 受 每 次 抖动 、 停 顿 和 心烦 
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意 乱 ， 是 否 足以 拿 来 取 均 值 呢 ? 在 古代 甚至 现代 ， 对 每 个 观测 环境 过 
于 熟悉 会 打消 组 合 观测 的 意愿 ， 人 们 忍 不 住 要 去 选择 那个 认为 是 最 好 
的 观测 ， 而 不 会 用 其 他 疑 为 较 差 的 观测 值 来 跟 它 求 均值 。 

即便 在 取 均 值 的 方法 变 得 司空 见 惯 之 后 ， 人 们 也 不 见得 总 能 接受 
“信息 少 即 是 多 ”的 想法 。19 世纪 60 年 代 ， 威 廉 姆 : 斯 坦 利 : 杰 文 斯 
提出 ， 通 过 价格 指数 来 测量 价格 水 平 的 变动 ， 也 就 是 采用 不 同 商品 价 
格 变 动 的 百分比 的 均值 ， 就 有 批评 人 十 认为 ， 把 生铁 和 胡椒 的 价格 放 
在 一 起 取 均 值 非常 荒 雇 。 并 且 ， 一旦 讨论 到 某 个 商品 ， 这 些 历史 知识 
渊博 的 研究 者 们 总 会 认为 ， 他 们 可 以 借助 某 个 特定 事件 发 生 的 缘由 故 
事 “ 解 释 ” 这 个 商品 的 每 个 变动 和 波动 。1869 年 ， 杰 文 斯 强烈 谴责 了 
这 种 理由 :“ 如 果 每 个 波动 都 需要 复杂 的 解释 , 那么 不 仅 这 个 主题 的 所 
有 相关 探索 都 没有 希望 ， 而 且 还 得 放弃 那些 依赖 数值 事实 的 完整 统计 
和 社会 科学 。” 这 并 不 是 说 讲述 数据 的 故事 错 了 , 而 是 说 数据 (以 及 单 
独 观 测 的 个 体 特点 ) 需要 置 于 背景 之 中 。 如 果 需 要 揭示 一 般 性 的 趋势 ， 
那么 必须 将 观测 视 为 一 个 集合 ， 必 须 把 它们 组 合 起 来 。 

ACTUS 路易 斯 ， 博 尔 赫 斯 理解 这 一 点 。 他 于 1942 年 出 版 了 奇 
幻 短篇 小 说 《 博 闻 强 识 的 富 内 斯 》， 其 中 描述 了 一 个 叫 作 伊 雷 内 奥 . 富 
内 斯 的 人 。 一 次 事故 后 ， 富 内 斯 发 现 自己 几乎 能 记 住 所 有 事情 。 他 能 
以 最 微小 的 细节 重新 建构 每 一 天 ， 其 至 以 后 能 再 重复 这 次 重 构 ， 但 他 
缺乏 理解 能 力 。 博 尔 赫 斯 写 道 :“ 思 维 是 忘却 差异 , 是 归纳 , 是 抽象 化 。 
而 富 内 斯 的 拥塞 世界 中 仅仅 充斥 着 触手 可 及 的 细节 。” 汇 总 产生 的 益处 
大 于 个 体 。 富 内 斯 正 是 没有 经 过 统计 处 理 的 大 数据 。 

算术 均值 是 什么 时 候 开始 用 于 概括 数据 集 的 ?又 是 在 什么 时 候 受 
到 广泛 采用 的 ? 这 两 个 问题 相当 不 同 。 第 一 个 问题 也 许 没 有 答案 ， 理 
随后 会 讲 。 第 二 个 问题 似乎 在 17 世纪 的 某 段 时 间 得 到 了 答案 , 但 无 
法 确定 精准 日 期 。 为 了 更 好 地 理解 测量 和 涉及 的 这 种 报告 问题 ， 我 们 
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来 看 一 个 有 趣 的 例子 ， 它 的 内 容 包括 了 可 能 最 早 使 用 “算术 平均 ”这 
种 说 法 的 出 版 例子 。 





1.1 指针 的 变化 


到 1500 年 ,热爱 冒险 的 水 手 日 益 增多 ,他们 把 磁 罗 盘 或 “指针 ” 
当 作 必 备 工具 。 无 论 在 任何 地 方 和 任何 天 气 情况 下 ， 指 南 针 都 可 以 读 
出 “ 磁 北 ”。 更 早 的 一 个 世纪 以 前 ， 人 们 就 已 经 公认 “ 磁 北 ”与 真正 的 
北方 有 差异 ; 而 1500 年 ， 人 们 还 认识 到 ,真正 的 北方 和 “ 磁 北 ”之 间 
的 差异 会 随 着 地 点 变动 。 差 异 数量 通常 比较 可 观 一 一 10*>， 也 许 偏 东 ， 
也 许 偏 西 。 当 时 ， 人 们 相信 原因 是 海边 缺乏 磁 引 力 ， 所 以 指南 针 的 偏 
差 指向 大 陆 而 偏离 海洋 。 因 此 ， 需 要 通过 指南 针 的 修正 找到 真正 的 北 
Ji, 这 称 为 “指针 的 变化 ”。 那 时 , 一 些 航 行 地 图 会 在 关键 位 置 ， 比 如 
通航 的 海峡 或 者 海上 可 见 的 显著 标志 ， 标 注 这 种 修正 的 已 知 大 小 ， 水 
手 们 信任 这 些 记录 的 偏差 。 威 廉 ， 吉尔 伯 特 1600 年 出 版 了 地 磁 学 经 典 
著作 《 论 磁 》》 其 中 给 出 报告 : 只 要 地 球 稳定 , 就 可 以 信赖 每 个 位 置 的 
变化 的 恒定 性 ,“ 因 为 磁 针 总 是 偏向 东 或 者 偏向 西 ， 所 以 即使 在 今天 ， 
无 论 在 任何 地 点 或 区 域 ， 无论 是 海洋 或 陆地 ， 变 化 弧度 都 保持 相同 。 
因此 ， 除 非 发 生 大 陆 崩 塌 和 国家 潭 炙 ， 就 像 柏 拉 图 和 其 他 古代 作家 所 
讲 的 亚 特 兰 带 斯 地 区 那样 ， 否 则 它 将 永远 不 变 ”。 

唉 ! KTAVBGEAMBT: pO" f. 16534E, SUR] - 盖 里 布 
兰 德比 较 了 伦敦 同一 地 点 、 时 间 相 隔 50 多 年 的 一 系列 磁 针 变化 的 测 
定 ， 他 发 现 这 些 变化 已 经 发 生 了 相当 大 的 变动 。1580 年 ， 真正 的 北方 
需要 向 东 修正 115; 而 在 1634 年 ， 修 正 已 经 减少 到 大 约 向 东 4"。 这 些 
早期 测量 结果 的 每 一 个 都 是 基于 几 个 观测 值 进 行 的 计算 ， 仔 细 分 析 后 
可 以 发 现 , 这 些 观 测 者 们 也 都 各 自在 朝 着 “使 用 算术 平均 ”摸索 前 进 ， 
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但 从 未 明确 说 明 要 这 么 做 。 

1581 年 , 威廉 - 布 劳 出 版 了 一 本 题 为 《指南 针 或 磁 针 变化 的 一 个 
讨论 》 的 小 册子 , 是 早期 测定 指针 变化 的 一 份 最 佳 记录 。 在 第 三 章 中 ， 
他 描述 了 测定 变化 值 的 一 种 方法 ， 这 种 方法 不 需要 预先 知道 真正 北方 
在 观测 点 的 什么 方位 ， 他 还 实际 演示 了 一 次 ， 在 伦敦 东部 尽头 的 港 
口 区 莱 姆 豪 斯 ， 那 地 方 距离 格林 尼 治 子午 线 不 远 。 他 提出 使 用 一 个 
星 盘 一 一 其 实 就 是 一 个 标 有 刻度 的 铜 盘 ， 垂 直 悬 挂 的 同时 用 一 个 取景 
器 观测 太阳 并 记 下 它 的 高 度 。 每 当 太阳 到 达 一 个 新 的 高 度 角 ( 在 中 午 
之 前 上 升 , 在 中 午 之 后 下 降 ), 他 就 观察 并 记录 罗盘 表面 一 条 阴影 线 的 
方向 , 这 样 可 以 取得 太阳 与 磁 北 偏差 的 一 个 读数 。 太阳 抵达 子午 线 时 ， 
高 度 角 会 达到 最 大 值 ， 那 时 它 在 真正 的 北方 ( 如 图 1-1 所 示 )。 
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D 3 
图 1-1 布 劳 使 用 的 罗盘 。 垂 直 的 柱子 在 罗盘 北端 , 标记 着 一 条 车 尾 
花 。 附 加 的 首 字母 R.N. 指 罗伯特 : 诺 曼 (Robert Norman ), 
他 预定 了 布 劳 的 小 册子 。 布 劳 在 文中 所 指 的 罗盘 上 的 “点 ” 
不 是 显示 的 8 个 点 ,而 是 由 分 割 线 将 其 间隔 再 分 割 为 4 部 分 ， 
因此 整个 圆 划 分 为 32 个 部 分 ,每 个 部 分 的 大 小 为 11°15"( 参 
JL Norman 1581 ) 













































































布 劳 会 考虑 在 同样 的 太阳 高 度 角 进行 的 每 一 对 观测 结果 ， 一 次 在 
上 午 ( 图 1-2 中 的 Fornoone, 以 下 命名 为 AM), 另 一 次 在 下 午 ( 图 1-2 
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中 的 Afternoone， 以 下 命名 为 PM )。 一 方面 ， 如 果 莱 姆 豪 斯 的 真正 北 
方 与 磁 北 一 致 ， 那 么 共同 值 应 该 是 ( 接近 ) 两 个 测量 的 中 点 。 因 为 太 
阳 经 过 了 一 个 对 称 弧度 , 在 子午 线 (“正午 ”) 的 角度 最 大 。 另 一 方面 ， 
如 果 磁 北 位 于 真正 北方 以 东 10°, 那么 早晨 的 阴影 应 该 向 西 偏 10", 并 
且 下 午 的 影子 也 一 样 。 无 论 哪 种 情况 ， 成 对 观测 的 平均 值 应 该 就 是 磁 
针 的 变化 。 布 劳 1580 年 10 H 16 日 观测 的 数据 表格 如 图 1-2 所 示 。 
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图 1-2 布 劳 1580 年 在 伦敦 附近 的 莱 姆 豪 斯 对 磁 针 变化 的 观测 数据 
(参见 Norman 1581 ) 














他 有 9 对 数据 ， 取 自 高 度 角 从 17°~25° 的 上 午 变 化 ( 偏 西 的 角度 ) 
和 下 午 变化 〈 偏 东 的 角度 ， 因 此 和 早晨 的 符号 相反 ; 除了 25° 的 下 午 
测量 ， 它 稍微 有 点 偏 西 ) 因为 上 午 和 下 午 的 符号 不 同 , 可 以 发 现 ， 
1-2 右 侧 栏 中 的 变化 是 变化 差 除 以 2 的 结果 。 例如 , 对 于 在 太阳 高 度 角 























23° 的 观测 对 ， 我 们 有 
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(AM + PM)/2 = (34? 40' + (-12? 0))/2 
= (34? 40' - 12? 02 
= (22° 40)/2 = 119 20* 

计算 出 的 这 9 个 测定 值 相 当 接近 ， 但 又 不 完全 相同 。 布 劳 是 如 何 
决定 报 哪 一 个 数字 的 呢 ? 在 前 统计 时 代 ， 很 明确 是 需要 数据 报告 的 ， 
有 是 又 因为 没有 一 致 认可 的 一 套 概括 方法 ， 故 而 也 就 不 需要 描述 什么 概 
括 方法 ， 实 际 上 也 没有 先例 可 循 。 布 劳 的 答案 很 简单 : 参考 右 侧 栏 ， 
也 写 道 ,“ 经 过 综合 考虑 , 我 确信 莱 姆 豪 斯 真正 的 磁 针 或 罗盘 的 变化 是 
11 又 1/4° 或 11 又 13°, 这 刚好 是 罗盘 上 的 一 个 点 或 稍 多 一 点 儿 的 值 ”。 
也 给 出 的 值 是 11°15'， 不 能 对 应 到 任何 现代 的 概括 度量 上 一 一 它 小 于 
均值 、 中 位 数 、 中 点 以 及 众 数 。 它 符合 22° 高 度 角 的 值 ， 并 有 可 能 就 
是 这 么 选 出 的 ,但 为 什么 23" 高 度 角 的 数字 会 给 出 11°20' 呢 ?也 或 许 和 
他 四 人 铭 五 和 人 到 与 “罗盘 上 的 一 个 点 ” 相 一 臻 ， 即 11°15'， 罗 盘 上 每 相 
邻 2 个 点 之 间 的 距离 。 无 论 如 何 , 布 劳 认为 没有 必要 给 出 正式 的 折 中 。 
他 可 以 取 上 午 和 下 午 同一 个 高 度 角 的 平均 值 ， 但 他 用 了 一 种 聪明 的 做 
ik: 使 用 观测 的 对 比 得 到 结果 ,而 不 使 用 基本 相等 的 观测 的 组 合 。“ 平 
均 ” 就 是 一 种 “前 减 后 ”的 对 比 。 

半 个 多 世纪 之 后 的 1634 年 ,格雷 山姆 学 院 天 文学 教授 盖 里 布 兰 德 
重 温 了 这 个 问题 (如 图 1-3 所 示 )。12 年 前 ,他 在 格雷 山姆 学 院 的 前 任 
埃 德 蒙 ' 甘 特 在 莱 姆 察 斯 重复 了 布 劳 的 实验 ， 得 到 磁 针 变化 的 8 个 测 
定 值 。 结果 范围 大 约 是 6", 与 布 劳 的 11 又 1/4* 相 去 甚 远 。 甘 特 是 一 位 
杰出 的 观测 者 ， 但 他 缺乏 将 这 个 结果 推广 成 一 项 发 现 的 想象 力 ， 而 将 
这 个 矛盾 之 处 归结 为 布 劳 的 错误 。 盖 里 布 兰 德 对 布 劳 极为 尊敬 ， 因 此 
并 不 支持 这 种 观点 , 他 遗憾 地 写 道 ;:“ 这 种 巨大 的 差异 使 得 我 们 当中 某 
些 人 过 早 地 中 伤 了 布 劳 先生 的 观测 ( 虽然 某 些 仅仅 是 借口 )” 盖 里 布 
兰 德 试 着 调整 布 劳 关于 太阳 视差 的 数字 ， 使 用 了 第 谷 : 布 拉 赫 的 一 个 
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方法 ， 布 劳 时 代 还 没有 这 个 方法 ， 但 是 发 现 影响 可 以 忽略 (比如 ， 布 
劳 对 于 20° 高 度 角 的 值 是 11922 又 1/2'， 变 成 了 大 约 11932 又 1/2), 于 
是 ， 盖 里 布 兰 德 开 始 使 用 昂贵 的 新 设备 (包括 一 个 代 蔡 星 盘 的 六 英尺 

四 分 仪 ) 在 德 特 福 德 进行 观测 ， 这 里 是 泰晤士 河南 岸 LEBENS 
河 相 望 ， 并 位 于 同一 经 度 。 
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图 1-3 盖 里 布 兰 德 小 册子 的 封面 (参见 Gellibrand 1635 ) 








1634 年 6 H 12 日 ， 盖 里 布 兰 德 采 用 基于 第 谷 表格 的 方法 ， 分 别 
做 出 了 磁 针 变化 的 11 个 测定 :5 个 在 上 午 ，6 个 在 下 午 (如 图 1-4 所 
示 )。 最 大 的 是 4?12'， 最 小 的 是 3"55'。 他 总 结 说 : 
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这 些 一 致 的 观测 产生 的 变化 不 会 大 于 4°12' 或 小 于 3°55'， 
算术 平均 将 其 限制 在 大 约 44'。( 此 处 的 “ 度 ” 的 原文 为 gr, 
简单 地 指 代 degree， 是 当时 的 一 种 “有 刻度 ”的 标尺 单位 。 
18 世纪 90 年代 法 国 大 革命 时 期 ， 标尺 用 gr. 指 代 grad， 表 示 
直角 的 1/100, ) 


Olfervations made at Diepford i». 16 34 Iunij 12 beforeNoone 


—————M—MM————À MÀ 
Alti O vera | Axim: Mag xim. © wariatto 
"Gr. Min. | Gr. CM. | Gr. M, Gr. M. 
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40 48 | 108: 0|103, 50 | 4: 10 














38 46 | 105. o| 100, 48 | 4. 12 
36 43 |102, 0| 97. 56 | 4. 4 
34 32) 9p 5| wn 2 | v oo 
32 10 96: o| 9t. 55 4 5 











Thefe Concordant Obfervations can not produce a 
variation greater then 4 gr. 12 min. nor leffe then 3 gr 
55 min. the Arithmeticall meane limiting it to 4 gr. 


and.about 4. minutes, 
图 1-4 盖 里 布 兰 德 的 数据 和 “算术 平均 值 ” 的 出 现 ( 参见 Gellibrand 
1635) 

















那么 , 盖 里 布 兰 德 报告 的 “均值 ”并 不 是 所 有 11 个 观测 的 算术 平 
均值 一 一 4%5'。 相 反 ， 他 给 出 了 最 大 值 和 最 小 值 的 平均 值 ， 也 就 是 后 
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世 统 计 学 家 们 所 说 的 “中 点 ”， 所 以 并 不 引 和 人 注目。 尽管 这 是 两 个 观测 
值 的 算术 平均 ， 但 好 像 也 没有 其 他 方式 可 以 生成 两 个 数 中 间 的 数值 
了 。 事 实 上 ， 早 年 的 天 文学 家 们 面 对 两 个 值 只 需要 取 一 个 时 ， 已 经 使 
用 了 算术 平均 或 者 类 似 的 计算 。 可 以 确定 , 第 谷 和 开 普 勒 在 17 世纪 早 
期 ,其 至 阿尔 - 比 鲁 尼 可 能 在 公元 1000 年 前 后 就 使 用 了 算术 平均 或 者 
类 似 的 计算 。 不 过 ， 盖 里 布 兰 德 给 所 用 的 方法 起 了 一 个 名 字 ， 这 个 术 
语 是 他 工作 的 新 颖 之 处 。 古 人 其 实 也 了 解 这 个 名 词 ， 但 看 来 没有 人 认 
为 真有 必要 把 它 用 于 自己 的 著作 中 。 

观测 的 统计 分 析 确 已 进入 新 阶段 , 一 个 标志 是 1668 年 英国 《皇家 
学 会 会 刊 》 中 的 一 个 简短 注 记 ， 其 内 容 还 是 与 磁 针 的 变化 有 关 。 编 辑 
享 利 ' 奥 尔 登 伯 格 刊登 了 某 位 姓名 简写 为 D.B. 的 人 的 信件 摘录 ， 其 中 
给 出 了 布 里 斯 托 尔 附近 的 某 个 位 置 磁 针 变化 产生 的 5 个 值 (如 图 1-5 
所 示 )。 






















































































An Extrait 
Of a Letter, written by D. B, tothe Publifber, concerning the pre- 
fent Declination of the Magnetick Needle, and the Tydes , 
May 23. 1668. 


Ir, I here prefent you with a Scheme of the Magnetical Vari- 
ations,as it was fent me by Capt. Samuel sib an experi- 
enced Seaman, and a Commander of a Merchant Ship for many 


years; who (as lie affüres, ————7,,— —.— — — 0 
me) took the Obfervati-| _____ Obferved Junerg. 1668. — 

















ons himfelfin the prefence Sun*s Obferv'd Magne-| Suns | Variat. í 
of Mr, Staysred;anantient Alitude. | bae d iis veters 
Mathematician, & others, ———— — 25 GE M » 
in Rowsham-Meadowes by |C". M. Gr. M. Gr. M.G. M. 
the water-fide, in fome|44 2072 0070 381 22i 
fach approach, Ithink,tol39 —— 3080 «078 241 36 
Briffol, as Lime-houfe or|31 5090 ocBs 26r 34 
the Fields adjoyning are to |27 4395 0093 36| 24 
London. This (as the|23 201103 oolror 23x 23l 
Table fhews ) was: taken | | 








June 13. 1666, Theyob- y 

ferved again in the fame day of the next year, viz, Fune13. 
1667; and then they found the Variation increaf’d about 6, mi- 
nutes Wefferlj, 











图 1-5 D.B. 信件 公开 的 部 分 (参见 D. B. 1668) 
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D. B. 报告 了 斯 特 米 船长 的 总 结 :“ 采 用 这 张 表格 的 时 候 ， 他 注意 
到 最 大 距离 或 差异 是 14'。 因 此 , 他 对 真正 的 变化 取 均 值 , 并 推断 在 当 
时 当地 ， 即 1666 年 6 月 13 日 的 变化 ， 仅 为 1927'。” 尽 管 真实 的 均值 
是 1?27.8', 并 且 斯 特 米 船 长 ( 或 者 数学 家 斯 特 恩 莱 德 ) 做 了 向 下 售 去 ， 
但 无 论 如 何 都 很 明显 , 到 17 世纪 的 最 后 三 十 多 年 , 算术 平均 值 已 经 受 
到 正式 认可 ， 成 为 组 合 观测 的 一 种 方法 。 它 的 诞生 时 间 也 许 永 远 是 个 
E, 但 其 诞生 事实 似乎 无 可 游 驶 。 













































































1.2 古代 的 聚合 


统计 概括 与 书写 一 样 拥有 悠久 的 历史 。 图 1-6 是 一 块 大 约 公元 前 
3000 年 〈 与 书写 的 起 源 时 间 很 接近 ) 的 苏 美 尔 人 的 泥 板 文书 复原 品 ， 
由 芝加哥 大 学 东方 研究 所 的 同事 克 里 斯 ， 伍 北向 我 展示 。 





























图 1-6 一 块 大 约 公 元 前 3000 年 的 苏 美 尔 人 泥 板 文书 重 现 ， 添 加 了 
现代 的 数字 ( 由 罗伯特 ' 英 格 伦 复原 ， 人 参见 Englund 1998, 
第 63 页 ) 








这 块 泥 板 代表 的 内 容 相当 于 一 个 2 x 3 的 列 联 表 ， 显 示 了 两 种 类 
型 的 商品 计数 ， 可 能 是 两 种 作物 3 年 内 的 产量 (加 上 了 现代 的 数字 ) 
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顶 上 一 行 显示 了 6 个 单元 格 ， 商 品 符号 显示 在 相应 的 计数 之 上 。 第 二 
行 是 年 份 或 者 列 的 总 计 ， 第 三 行 是 两 种 作物 行 的 总 计 ， 底 部 是 全 体 的 
合计 值 。 今 天 我 们 会 以 不 同方 式 重 列 这 些 数字 ， 如 表 1-1 所 示 。 





















































表 1-1 苏 美 尔 人 泥 板 文书 数字 记录 的 列 联 表 形式 
年 份 1 年 份 2 年 份 3 总 证 
作物 A 9 12 16 37 
作物 B 13 19 15 47 
合计 22 31 31 84 


统计 分 析 没 有 保存 下 来 ， 但 可 以 确定 其 中 不 包括 卡 方 检验 。 我 们 
能 说 的 是 ， 这 块 泥 板 展现 了 那个 时 代 的 高 水 平 统计 智慧 ， 但 它 没有 离 
个 别 数据 值 走 得 太 远 : 不 仅 表格 主体 展现 了 每 年 所 有 作物 的 计数 ， 泥 
板 背 面 还 给 出 了 这 些 计数 依赖 的 原始 数据 、 个 体 生 产 者 的 个 数 。 甚 至 
5000 年 前 就 有 人 认为 公开 原始 数据 是 有 用 的 ! 

数据 统计 的 科学 分 析 始 于 何 时 呢 ? 算术 平均 值 的 使 用 是 什么 时 候 
变 为 统计 分 析 的 一 个 正式 组 成 部 分 的 ? 真 的 没有 在 17 世纪 以 前 很 久 
吗 ? 为 什么 更 早 的 时 代 没 有 用 均值 对 天 文 、 调 查 和 经 济 进行 组 合 观 
测 ? 古代 的 均值 数学 是 众所周知 的 。 毕 达 哥 拉 斯 学 派 在 公元 前 280 年 
已 经 了 解 均值 的 3 种 类 型 : 算术 平均 值 、 几 何平 均值 和 调和 平均 值 。 
公元 1000 年 时 ， 哲 学 家 波 伊 修 斯 将 均值 数量 提高 到 了 至 少 10 种 ， 包 
括 毕 达 哥 拉 斯 的 3 种 在 内 。 不 可 否认， 这 些 均值 是 在 哲学 意义 下 展开 
的 ， 主 要 用 于 讨论 线段 的 比例 ， 以 及 音乐 ， 而 非 用 于 数据 总 结 。 

我 们 当然 可 以 期 待 , 古 希 腊 人 、 古 罗马 人 或 者 古 埃及 人 早 在 2000 
多 年 前 日 复 一 日 的 生活 中 ， 就 已 经 摸索 出 对 数据 取 均 值 。 又 或 者 他 们 
并 没有 这 样 做 , 但 可 以 肯定 的 是 , 早 在 1000 年 前 的 阿拉 伯 科 学 的 杰出 
天 文 研 究 中 ， 就 可 以 找到 均值 。 但是， 哪怕 只 是 想 在 这 些 来 源 中 找到 
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一 个 证 据 充分 的 例子 ， 费 尽心 血 广 泛 搜索 之 后 ， 也 总 是 免不了 落空 。 

针对 早期 使 用 均值 的 历史 ， 最 坚定 的 搜索 者 是 不 屈 不 挠 的 研究 者 
吉尔 艾 森 哈 特 ， 他 在 国家 标准 局 度 过 了 大 部 分 职业 生涯 。 数 十 年 
E, 艾 森 哈 特 一 直 追 踪 均 值 的 历史 应 用 , 并 在 1971 年 美国 统计 学 会 的 
主席 演讲 中 总 结 了 自己 的 研究 。 他 热情 洋溢 地 演讲 了 近 2 小 时 ,但 他 
发 现 的 对 于 所 有 均值 的 相关 使 用 工作 、 有 证 据 表明 使 用 均值 的 最 早 工 
作 等 ， 就 是 我 前 面 提 到 过 的 由 D. B. 和 盖 里 布 兰 德 做 出 的 。 艾 森 哈 特 发 
W, 希 帕 克 (大约 公元 前 150 4E) 以 及 托 勒 密 ( 大 约 公 元 150 4E ) 对 
自己 的 统计 方法 默 不 作 声 ， 而 阿尔 - 比 鲁尼 (大约 公元 1000 年 ) 则 使 
用 通过 二 分 最 小 值 和 最 大 值 之 差 产 生 的 数 一 一 并 不 接近 均值 。 均 值 很 
时 就 出 现在 印度 的 应 用 几何 中 ， 婆 罗 摩 及 多 在 公元 628 年 写 的 一 本 关 
于 测量 的 小 册子 中 有 这 样 的 建议 : 处 理 挖掘 问题 时 ， 要 使 用 与 控 掘 平 
均 规 模 相 一 致 的 长 方 体 当 作 不 规则 挖掘 量 的 近似 值 。 

所 有 这 些 年 代 的 历史 证 据 表 明 ， 人 们 收集 了 许多 类 型 的 数据 。 某 
些 情况 下 ， 不 可 避免 需要 概括 。 如 果 不 使 用 平均 值 ， 人 们 需要 做 什么 
以 进行 总 结 呢 ? 选 定单 个 数字 进行 报告 吗 ? 我们 先 看 几 个 例子 ， 其 中 
运用 了 类 似 于 均值 的 概念 ， 看 完 之 后 也 许 会 更 好 地 理解 前 统计 时 代 人 
们 是 怎样 看 这 些 问 题 的 。 

修 昔 底 德 讲 过 一 个 关于 攻 城 梯 的 故事 ， 发 生 在 公元 前 428 年 : 
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“一 方 为 了 达到 敌人 城墙 的 高 度 ， 需要 制造 一 批 梯 子 。 因 
为 城墙 面向 他 们 的 一 面粉 刷 不 仔细 ， 所 以 可 以 根据 测量 砖 的 
层 数 计算 城墙 的 高 度 。 许 多 人 同时 数 砖 的 层 数 ， 尽 管 有 些 人 
可 能 会 数 错 ,， 但 大 多 数 人 会 数 对 ， 尤 其 是 多 次 计数 之 后 。 并 
且 他 们 距离 城墙 也 不 远 ， 完 全 可 以 看 清楚 。 计 算 砖 块 的 厚度 
后 ， 就 可 以 进一步 推算 梯子 要 求 的 长 度 了 。” 
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修 昔 底 德 描述 了 所 谓 “ 众 数 ”( mode， 最 频繁 报告 的 值 ) 的 使 用 。 
因为 计数 过 程 缺 失 独立 性 的 预期 ， 众 数 并 不 非常 精确 。 但 如 果 报 告 非 
常 接 近 ， 那 它 就 和 任何 其 他 概括 一 样 好 。 修 昔 底 德 并 没有 给 出 数据 。 

另 一 个 很 晚 的 例子 来 自 16 世纪 早期 ， 由 雅 各 布 ， 科 贝尔 在 一 本 
关于 测量 的 图 文 并 茂 的 书 中 提 到 。 科 贝尔 说 ， 那 个 时 代 士 地 测量 的 基 
本 单位 用 一 根 16 英尺 长 的 木 棒 来 确定 。 而 且 ， 当 时 的 1 英尺 〈foot ) 


真 的 表示 一 只 脚 长 ， 但 是 





谁 的 脚 呢 ? 肯定 不 是 国王 的 脚 ， 也 不 是 每 次 





台 都 会 要 求 重 新 商定 土地 合约 的 新 君主 的 脚 。 科 贝尔 说 到 的 解决 方 


案 简 单 而 优雅 : 











在 教 党 礼拜 之 后 























留 下 16 位 市 民 代表 ( 那 时 都 是 男性 ), 





他 们 鞋 尖 对 着 鞋 跟 , 站 成 一 条 线 , 这 条 线 的 长 度 就 是 那 根 16 英尺 木 棒 


的 长 度 。 科 贝尔 的 
1-7 所 示 )。 
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图 片 由 他 自己 蚀刻 ， 是 一 幅 解释 艺术 的 杰作 《〈 如 图 


fr E 












































图 1-7 fH X 


F 确 定 一 根 合 法 木 棒 的 描述 (Kobel 1522) 
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这 真是 一 根 “ 社 区 的 ” 木 棒 ! 而 且 ， 这 根木 棒 确 定 以 后 ， 又 细 分 
为 16 个 相等 的 部 分 ， 每 个 部 分 都 表示 这 根 公 共 木 棒 中 单 只 脚 ( 即 1 
英尺 ) 的 度量 。 从 功能 角度 讲 ， 这 就 是 16 个 人 的 脚 长 的 算术 平均 值 ， 
但 “均值 ”这 个 术语 在 任何 地 方 都 未 提 及 。 

这 两 个 例子 相隔 大 约 2000 F, 但 它们 都 涉及 一 个 共同 问题 : 如 何 
概括 一 组 相似 但 不 完全 相同 的 测量 。 每 种 情况 中 ， 解 决 问题 的 方式 反 
映 了 组 合 涉及 的 智力 困难 ， 这 种 困难 到 今天 依然 存在 。 在 古代 和 中 世 
纪 ， 每 当 需 要 概括 不 同 数据 时 ， 人 们 便 选择 个 别 的 例子 。 修 背 底 德 的 
故事 中 ， 被 选中 的 个 别 例子 是 最 主流 的 情形 一 一 众 数 。 而 在 其 他 示例 
中 ， 也 可 以 选择 那个 最 突出 的 例子 ; 对 数值 数据 而 言 ， 甚 至 可 以 选择 
最 大 的 那个 记录 值 。 每 个 社会 都 希望 宣扬 它们 最 好 的 部 分 以 代表 整体 
社会 ， 或 者 选择 的 情形 也 可 以 是 基于 不 明确 的 理由 而 选择 的 “最 佳 ” 
个 体 或 值 。 天 文学 中 ,“ 最 佳 ” 值 的 选择 可 能 反映 了 观测 者 的 个 人 知识 
或 观测 的 天 文 条 件 。 但 无 论 做 了 什么 ， 这 意味 着 要 保持 至 少 一 个 数据 
值 的 个 别 特征 。 科 贝尔 的 记述 中 , 重点 是 16 只 个 体 的 脚 , 甚至 可 以 在 
图 片 中 认 出 那 时 的 人 们 。 无 论 如 何 ,“ 由 个 体 共 同 决定 木 棒 长 度 ”， 这 
种 思想 是 一 个 强 有 力 的 观点 ， 因 为 这 没有 抛弃 它们 的 个 性 。 这 是 木 棒 
合法 性 的 关键 ,甚至 也 决定 了 单独 的 英尺 标志 是 真正 意义 的 平均 。 




































































1.3 平均 人 





到 了 19 世纪 ,均值 已 经 广泛 运用 于 天 文学 与 测 地 学 。19 世纪 30 
年 代 ， 它 还 在 社会 中 开辟 了 更 广阔 的 应 用 空间 。 那 时 ， 比 利 时 统计 学 
家 阿道夫 ' 弛 特 勒 开创 了 他 所 谓 的 “社会 物理 学 ”"。 为 了 可 以 在 不 同 
人 群 之 间 进 行 比较 ， 他 引入 了 “平均 人 ”的 概念 。 最 初 ， 凯 特 勒 将 这 
个 概念 当 作 人 类 种 群 之 间 的 比较 工具 ， 或 用 来 刻画 单个 种 群 随时 间 发 
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生变 化 的 情况 。 有 了 这 一 工具 ， 便 可 以 比较 英国 人 和 法 国人 的 平均 身 
高 ; 也 可 以 随 着 时 间 的 变化 记录 某 一 年 龄 的 平均 身高 ， 由 此 导出 一 条 
种 群生 长 曲线 。 社 会 中 不 存在 单个 的 “平均 人 ”, 每 个 种 群 都 有 自己 的 
“平均 人 ”。 男 外 ,凯特 勒 只 关注 男性 ， 女 性 不 在 考虑 之 内 。 

19 世纪 40 EIR, 一 位 批评 家 开始 攻击 这 种 思想 。 安 东 尼 ， 奥 古 
斯 十 库 尔 诺 认 为 ,“ 平 均 人 ”必然 身体 畸形 : 任何 一 个 种 群 中 , 真正 
出 现 具有 平均 身高 、 体 重 和 年 龄 的 人 的 可 能 性 非常 低 。 库 尔 诺 指出 ， 
对 一 组 直角 三 角形 相应 的 边 进行 平均 再 组 成 新 的 三 角形 ， 得 到 的 图 形 
不 会 是 直角 三 角形 ( 除非 这 些 三 角形 都 是 彼此 成 比例 的 )。 

另 一 位 批评 家 是 生理 学 家 克 劳 德 ， 伯 纳 德 ， 他 在 1865 年 写 下 这 
样 一 段 话 : 

































































“数学 在 生物 学 中 的 另 一 个 频繁 应 用 是 平均 值 的 使 用 ,可 
以 说 这 在 医学 和 生理 学 中 必然 导致 错误 …… 如 果 我 们 收集 一 
个 人 24 小 时 内 的 尿 液 , 混合 起 来 分 析 平 均值 ,那么 得 到 的 是 
对 一 种 根本 不 存在 的 尿 液 的 分 析 。 禁 食 时 的 尿 液 不 同 于 消化 
时 的 尿 液 。 一 位 生理 学 家 发 明了 诸如 此 类 的 一 个 惊人 实例 ， 
他 选择 了 一 座 各 国人 都 会 经 过 的 火车 站 ,从 小 便 池 取出 尿 液 ， 
并 相信 自己 能 据 此 提出 一 份 针对 普通 欧洲 人 的 尿 液 分 析 1” 


这 种 批评 没有 吓 倒 凯特 勒 ， 他 坚 称 “ 平 均 人 ”可 以 作为 一 组 人 中 
的 一 个 “典型 ”样本 。 这 个 样本 抓 住 了 “类 型 "， 可 以 作为 一 组 人 的 代 
表 用 于 比较 分 析 。 因此 , 这 个 概念 高 度 成 功 并 经 常 受到 滥用 。 “平均 人 ” 
及 其 衍生 概念 发 展 出 一 套 理论 体系 ， 使 一 些 物理 科学 方法 得 以 运用 于 
社会 科学 。 

19 世纪 70 年 代 ， 弗 朗 西 斯 ' 高 尔 顿 分 析 非 定量 数据 时 进一步 采 
用 了 均值 的 思想 。 他 花费 大 把 时 间 和 精力 ， 根 据 肖 像 的 组 合 构建 所 谓 
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的 “一 般 性 肖像 "。 其 中 , 通过 释 加 一 组 中 若干 成 员 的 图 像 ,本质 上 生 
成 了 这 一 组 中 男士 或 女士 的 平均 图 像 (如 图 1-8 所 示 )。 高 尔 顿 发 现 ， 
从 姐妹 和 其 他 家 庭 成 员 之 间 的 面容 相似 之 处 可 以 提取 家 族 特 征 。 他 也 
用 了 其 他 和 群 组 进行 实验 ， 生 成 了 亚历山大 大 帝 的 勋章 组 合 〈 希望 能 揭 
示 出 更 逼真 的 画像 )， 以 及 罪犯 群 组 和 相同 疾病 的 患者 群 组 。 
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图 1-8 高 尔 顿 的 一 些 复合 肖像 (Galton 1883) 





高 尔 顿 合成 照片 时 施加 了 一 些 约束 ， 他 很 清楚 这 种 一 般 性 肖像 的 
局 限 性 。 正 如 他 自己 的 解释 :“ 没 有 哪 位 统计 学 家 会 梦想 着 组 合 那些 同 
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属 一 个 种 群 但 没有 共同 的 中 心 聚集 目标 的 对 象 。 我 们 不 应 再 用 异 质 元 
素 组 合 一 般 性 肖像 ， 如 果 这 样 做 ,结果 会 很 可 怕 而 且 毫 无 意义 。 他 的 
一 些 追 随 者 并 没有 这 样 谨慎 。 一 位 名 叫 拉 斐 尔 ' 庞 佩 利 的 美国 科学 家 
于 1884 年 4 月 参加 美国 国家 科学 院 会 议 时 为 一 些 与 会 者 拍摄 了 照片 ， 
第 二 年 , 他 发 表 了 图 片 合成 的 结果 。 图 1-9 是 其 中 一 个 例子 , 这 是 由 12 
位 数学 家 (这 个 称呼 在 当时 还 包括 天 文学 家 和 物理 学 家 ) 的 肖像 县 加 
生成 的 “平均 ”数学 家 的 合成 图 片 。 除 了 这 张 图 片 里 的 人 看 起 来 和 高 
尔 顿 合成 的 那些 罪犯 一 样 阴险 之 外 ,我 们 还 会 注意 到 ， 将 胡子 剃 干净 
的 人 、 一 些 络 腮 胡 子 的 人 以 及 更 多 一 些 蓄 小 胡子 的 人 的 肖像 组 合 后 ， 
产生 的 类 型 看 起 来 更 像 是 某 个 一 周 没 刮 胡子 的 人 。 
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图 1-9  JEDRURJBS 12 位 数学 家 的 复合 肖像 (Pumpelly 1885) 





1.4 聚合 与 地 球 的 形状 


到 18 世纪 中 期 , 统计 聚合 的 运用 已 经 扩展 至 许多 场合 , 其 测量 是 
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在 近 异 环境 中 做 出 的 。 事 实 上， 这 也 是 环境 使 然 。 一 个 最 简单 的 例子 
是 18 世纪 关于 地 球形 状 的 研究 。 初 步 估 计 , 地球 是 一 个 球体 ; 但 随 着 
航海 和 天 文学 精度 的 增加 ， 问 题 随 之 而 来 。 艾 萨 克 “' 牛顿 出 于 动态 角 
度 的 考虑 , 提出 地 球 是 个 略 扁 的 球体 ( 在 两 极 处 压缩 , 在 赤道 处 膨胀 )。 
法 国 天 文学 家 多 美 尼 科 “' 卡 西 尼 则 认为 ， 地 球 是 一 个 扁 长 的 球体 
在 两 极 拉 长 。 要 想 解 决 这 个 问题 ， 可 以 比较 在 不 同 纬度 的 地 面 做 出 的 
测量 。 从 赤道 到 北极 的 几 个 不 同 地 点 ， 可 以 测量 出 一 个 相对 较 短 的 弧 
长 一 一 4。 这 条 弧 的 方向 垂直 于 赤道 ， 是 由 北极 到 赤道 的 所 谓 子午 线 
1/4 辆 的 一 段 , 可 以 先 测量 沿 着 地 面 的 弧 长 ,再 除 以 两 个 端点 的 纬度 差 ， 
结果 是 单位 纬度 的 弧 长 。 纬 度 可 通过 仪器 观测 北极 星 与 水 平 线 的 夹 角 
测 得 。 观 察 这 个 1° 的 弧 是 如 何 随 着 到 赤道 的 距离 变动 的 ， 即 可 解决 这 
个 问题 。 

椭圆 积分 给 出 了 球体 的 弧 长 与 纬度 之 间 的 关系 ， 但 一 个 简单 公式 
就 足以 计算 短 距 离 ( 而 且 实 际 上 , 只 有 比较 短 的 距离 才 可 以 测量 ) 令 
4= 沿 着 地 面 测量 的 1° 弧 长 , L= 弧 中 点 的 纬度 一 一 这 也 是 通过 观测 北 
极 星 决定 的 ， 则 赤道 有 元 = 0*, RA L-909. Wb, A=z+ ysin? L 
可 以 良好 地 近似 每 个 测量 的 短 弧度 : 






















































































































































































如 果 地 球 是 一 个 完美 的 球体 ， 那 么 y = 0 并 且 所 有 的 1° 
陶 具 有 相同 的 长 度 z。 

如 果 地 球 是 扁平 的 (牛顿 )， 那 么 y>0 并 且 绝 长 在 赤道 
为 z (sin'09 — 0), 而 在 北极 点 变 为 z+y (sin”90°= 1), 

如 果 地 球 是 扁 长 的 ( 卡 西 尼 )， 那 么 y<0。 



































上 的 值 可 以 认为 是 一 种 极地 超额 ( 如 果 值 为 负 , 那 就 是 不 足 )“ 椭 
圆 率 ”( 从 球形 形状 出 发 的 偏离 测量 ) 可 以 近似 地 计算 为 e = y3z, 一 
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个 稍微 改进 的 近似 计算 式 是 e= y/(3z + 2y) (有 时 会 用 到 )。 

计算 需要 数据 。 这 个 问题 听 起 来 很 容易 : 测量 任意 两 个 度数 ， 也 
许 一 个 在 赤道 ， 男 一 个 在 罗马 附近 。 那 个 年 代 的 长 度 采用 “ 突 阿 斯 ” 
( Toise ) 计量 ， 是 “ 米 ” 制 单位 出 现 之 前 的 单位 ， 一 突 阿 斯 约 合 6.39 
英尺 ?。1° 的 纬度 大 约 有 70 英里 ”那么 长 ,实地 测量 太 长 、 太 难 ， 因 此 
需要 测量 一 个 短 的 距离 再 做 推断 。1736 年 ， 皮 埃 尔 : 布 格 率领 一 个 法 
国 考察 队 ， 在 今天 厄瓜多尔 的 基 多 附近 进行 测量 ， 那 里 可 以 在 南北 方 
向 上 测量 接近 赤道 的 较 长 距离 。 他 测 出 的 长 度 是 4= 56 751 突 阿 斯 以 
及 sin? L= 0。1750 年 ， 耶 稣 会 学 者 鲁 杰 罗 . REM- 博 斯 科 维 奇 发 现 
罗马 附近 的 测量 值 是 4=56 979 突 阿 斯 以 及 sin? L= 0.4648。 这 给 出 
了 两 个 方程 : 








































































































56751=z+y-0 
56 979 =z + y - 0.4648 
这 些 方程 很 容易 解 出 ， 得 到 z= 56751 和 y= 228/0.4648 = 490.5, 
以 及 e= 490.5/(3 - 56 751) = 1347， 那 时 人 们 喜欢 这 人 么 写 计算 结果 。 
但 在 18 世纪 50 年 代 末 ， 到 博 斯 科 维 奇 写 出 关于 这 个 问题 的 报告 
为 止 , 已 经 存在 5 个 而 不 是 2 个 获得 肯定 的 弧 长 记录 : WZ (In 
America )、 罗 马 (InItalia) EZ (In Gallia )、 拉 普兰 (In Lapponia ) 
以 及 一 路 南下 直到 非洲 最 南端 的 好 望 角 (Ad Prom. B. S. )。 其 中 任何 两 
个 都 会 给 出 一 个 结果 ,因此 博 斯 科 维 奇 面 临 数据 的 窖 境 : 共 有 10 个 解 ， 
且 它 们 各 不 相同 ( 如 图 1-10 和 图 1-11 所 示 )。 





















































四 约 为 1.95 米 。 一 一 译 者 注 
®© 约 112.7 千 米 。 一 一 译 者 注 
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图 1-10 博 斯 科 维 奇 的 5 个 弧 长 数据 。 各 列 ( 用 我 们 的 记号 ) 对 
i= 1-5 的 每 个 弧 给 出 了 维度 L; (用 "表示 )、sin2 万 [= U2* 
(1 ^ cosL;) = 1/2 * versin Lj]. 4; (hexapedae， 用 突 阿 斯 表示 
的 长 度 ) A4; ALÉS2E, REF L5 的 解 的 差 .以 及 这 些 
差 之 间 的 差 。 好 望 角 的 sin? 工 值 应 该 是 3014， 而 不 是 2987 
(参见 Boscovich 1757 ) 
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图 1-11 博 斯 科 维 奇 计算 的 10 对 弧 , 对 应 每 对 弧 都 给 出 极地 超额 ) 
以 及 椭圆 率 e = 3y/z。(2, 4) 和 (1, 3) 的 椭圆 率 印 刷 有 误 ， 应 
该 是 11282 和 1/178。(1, 4 的 数字 有 误 ,应 该 是 560 和 1/304 
(Boscovich 1757 ) 




















博 斯 科 维 奇 现在 进退 两 难 。5 个 测量 的 弧 不 一 致 ， 他 应 该 随便 先 
择 其 中 一 对 并 接受 这 个 结果 吗 ? 恰恰 相反 ， 他 创造 了 一 种 真正 新 颖 的 
聚合 方法 ， 给 出 了 综合 5 种 结果 后 的 客观 答案 。 博 斯 科 维 奇 认为 ， 数 
据 中 最 不 可 靠 的 要 素 就 是 弧 的 测量 。 这 些 弧 需 要 在 极端 困难 的 环境 下 
仔细 测量 ， 从 巴黎 和 罗马 附近 的 森林 到 非洲 之 角 ， 再 到 拉 普兰 的 冰冻 
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苦 原 ， 以 及 世界 另 一 端的 厄瓜多尔 平原 。 而 且 ， 几 乎 不 可 能 为 了 进行 
仿 查 而 重复 这 些 测量 。 根 据 方程 4=z +ysin?2 工 ， 博 斯 科 维 奇 进行 了 如 
下 推理 : z 和 y 的 每 个 选择 都 隐 含 着 4 的 一 个 对 应 值 , 并 且 这 个 值 和 观 
测 值 的 差 可 以 认为 是 一 种 调整 ， 需 要 对 观测 的 4 进行 这 种 调整 以 使 测 
量 匹 配方 程 。 所 有 可 能 的 z 和 y 中 ， 隐 含 着 “寻找 调整 绝对 值 总 和 的 
最 小 值 ”的 目的 ， 还 假定 选 出 的 > 和 了 与 各 个 A 的 均值 和 各 个 工 的 均 
值 相 一 致 。 博 斯 科 维 奇 给 出 了 一 种 聪明 的 算法 求解 最 佳 值 ， 就 是 现在 
所 谓 “ 线 性 规划 问题 ”的 早期 实例 。 对 于 这 5 个 弧 ， 根 据 他 的 方法 求 
出 的 答案 为 : z=56751、y=692、e= 1/246。 

接 下 来 的 半 个 世纪 ， 人 们 提出 了 多 种 方法 ， 通 过 某 种 聚合 形式 整 
合 不 同 条件 下 不 一 致 的 测量 。 最 成 功 的 方法 是 最 小 二 乘法 ， 它 在 形式 
上 是 观测 的 加 权 平 均 ， 而 优势 是 很 容易 扩展 为 其 他 更 复杂 的 形式 ， 从 
而 决定 多 个 未 知 量 。1805 年 ， 阿 德里 安 - 玛 丽 ， 勒 让 德 首次 公布 了 这 
种 方法 一 一 在 一 本 解释 如 何 确定 彗星 轨道 的 书 中 。 勒 让 德 给 出 了 说 明 
测定 地 球 椭圆 率 的 例子 ， 采 用 的 测量 是 法 国 大 革命 之 后 定义 “ 米 ” 的 
长 度 的 方法 。 这 些 数据 给 出 的 椭圆 率 是 1/148, 这 个 数值 很 大 , 但 由 于 
弧 的 范围 更 短 ( 只 有 10° 的 纬度 ,全 在 法 国之 内 )， 并 且 与 其 他 值 不 一 
致 , 因此 人 们 认为 它 还 不 如 早期 从 赤道 到 拉 普 兰 范围 内 的 测量 。 所 以 ， 
最 终 的 “ 米 ” 是 基于 不 同 考 察 的 混合 值 而 决定 的 。 

聚合 具有 多 种 形式 一 一 从 简单 的 加 总 到 不 透明 抽检 的 现代 算法 。 
但 是 ,使 用 概括 取代 完全 枚 举 个 体 观测 的 原则 ， 和 通过 选择 性 地 丢弃 
言 息 以 获取 信息 的 原则 ， 都 是 一 脉 相 承 的 。 
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信息 : 度量 与 变化 率 





第 二 根 支 柱 一 一 信息 度量 一 一 从 逻辑 上 与 第 一 根 文 柱 紧密 相关 : 
如 果 我 们 通过 组 合 观测 值 获取 信息 ， 那 么 获取 的 信息 与 观测 个 数 有 何 
联系 ? 我们 应 该 如 何 度量 信息 的 价值 和 获取 过 程 ” 这 个 问题 的 历史 悠 
久 又 有 趣 ， 可 以 追溯 到 古 希 腊 。 

在 古 希腊 ,“ 沙 堆 悖 论 ” 非 常 著名 : 一 粒 沙 不 成 沙 堆 ; 向 一 滩 沙子 
添加 一 粒 沙 ， 也 不 会 使 它 变 成 沙 堆 。 但 是 ， 每 个 人 也 都 同意 ， 无 论 如 
何 ， 沙 子 确 实 累积 成 了 沙 堆 。 一 般 认 为 ， 在 公元 前 4 世纪 ， 哲 学 家 米 
利 都 的 欧 布 里 德 提出 了 这 个 悖 论 。5 个 世纪 以 后 ， 生 理学 家 、 哲 学 家 
盖 伦 将 其 作为 一 个 统计 问题 再 次 提出 ， 他 展示 了 一 个 经 验 主 义 者 和 一 
个 教条 主义 者 之 间 的 争论 。 

这 个 教条 主义 者 是 个 早期 的 医学 理论 家 ， 他 会 使 用 逻辑 开 药 方 : 
这 种 症状 说 明 患 者 体质 偏 寒 还 是 偏 热 ? 相应 地 判断 应 该 为 患者 升温 还 
是 降温 。 患 者 身体 里 是 否 存 在 某 种 有 毒 元 素 ? 如 果 有 ， 那 么 通过 放血 
或 其 他 方法 排毒 。 

而 经 验 主义 者 是 证 据 论 医学 的 支持 者 。 如 果 对 治疗 有 怀疑 ， 就 查 
看 记录 : 放血 或 升温 有 多 少 次 是 有 效 的 ?这 种 疗法 以 前 有 用 吗 ? 以 前 
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失败 过 吗 ? 充 分 积累 支持 这 种 疗法 的 有 利 证 据 后 ， 它 就 会 作为 一 种 标 
准 被 采用 ， 而 在 那 之 前 都 要 保持 怀疑 的 态度 。 

教条 主义 者 使 用 “ 沙 堆 悖 论 ” 反 击 : 仅仅 一 个 有 利 的 证 据 当然 不 
足以 得 出 一 般 性 结论 ; 而 且 ， 当 你 处 在 任何 不 确定 的 阶段 ， 多 积累 一 
个 有 利 证 据 又 怎 会 打破 平衡 ?” 你 会 因此 不 再 信任 单一 证 据 吗 ? 但 如 此 
一 来 ， 你 又 如 何 信任 证 据 的 积累 ? 可 是 ， 正 如 不 可 否认“ 沙 堆 ” 的 存 
在 ， 令 人 信服 的 医疗 记录 也 是 存在 的 。 盖 伦 文 持 经 验 主 义 者 ， 并 认为 
必须 充分 重视 医学 史上 积累 的 证 据 。 但 问题 依然 存在 : 证 据 的 确 越 多 
越 好 ， 但 究竟 好 了 多 少 ? 这 在 很 长 一 段 时 间 里 没有 确切 答案 。 






























































2.1 铸币 检查 试验 


“缺乏 答案 导致 成 本 增加 ”的 一 个 例子 是 铸币 检验 的 试验 问题 。12 
世纪 的 英格兰 没有 单一 、 强 大 、 中 央 集 权 的 权威 ， 这 对 实施 货币 政策 
构成 了 挑战 。 虽 然 实 际 上 有 国王 在 位 ， 但 几 位 势力 强大 的 贵族 制衡 了 
他 的 权威 ， 这 些 贵族 甚至 通过 1215 年 的 《大 宪章 》 强 迫 约翰 王 放 弃权 
力 。 就 在 同时 ( 或 稍 早 一 些 时 一 一 早期 的 历史 稍 有 点 模糊 ), 社会 中 产 
生 了 对 普遍 认可 的 货币 的 商业 需求 ， 这 种 货币 可 以 获得 广泛 承认 。 伦 
敦 铸币 厂 是 英国 硬币 的 主要 来 源 ， 而 且 它 在 1851 年 变 为 皇家 铸币 厂 ， 
同时 交 由 王国 政府 独立 运作 。 国 王 和 贵族 向 铸币 厂 提供 金 银 儿 ， 再 收 
回 硬币 作为 回报 。 为 了 保证 该 流程 完美 无 缺 ， 国 王 的 契约 发 挥 了 巨大 
作用 ， 它 详细 规定 了 硬币 的 重量 和 成 色 。 为 了 监督 铸币 厂 成 功 达 到 规 
定 的 标准 ， 这 份 契约 专门 指出 ， 应 该 通过 试验 检验 铸币 厂 的 产品 。 这 
是 在 生产 过 程 中 监测 保证 质量 水 平 的 早期 实例 。 

这 种 铸币 三 试 验 至 少 始 于 13 世纪 晚期 ， 或 许 还 要 更 早 一 个 世纪 。 
此 后 的 时 代 有 了 试验 过 程 的 更 详细 描述 ， 但 之 前 应 该 也 不 可 能 有 太 多 
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变化 。 生产 中 , 工人 每 天 都 会 选择 一 些 货币 放 入 “货币 检验 箱 ”( Pyx )， 
以 便 日 后 检验 。 选择 并 不 是 严格 随机 的 , 但 账目 中 运用 的 一 些 词汇 ( 比 
如 “公正 地 ”或 者 “随意 取得 ”) 说 明 它 和 随机 样本 差不多 。 货 币 检验 
箱 会 当 着 评审 人 的 面 在 不 同 的 时 间 间 隔 ( 在 14 世纪 是 每 3 个 月 ) 打 开 ， 
这 些 评审 人 代表 了 与 硬币 精度 利益 似 关 的 各 方 团体 。 接 着 再 进行 一 次 
选择 ， 对 一 些 硬币 进行 化 验 以 检验 金子 的 成 色 ， 用 男 外 一 些 以 检验 重 
量 。 后 者 吸引 了 统计 界 的 兴 

大 家 都 能 理解 ， 不 同 硬币 的 重量 不 可 避免 会 有 不 同 ， 而 契约 专门 
指定 了 目标 重量 (用 了 指 代 ) 以 及 一 个 称 为 “公差 ”( remedy, JH RH 
代 ) 的 可 接受 限度 。 如 果 重 量 低 于 了 -有 R， 铸 币 厂 的 厂 主 就 必须 支付 相 
应 的 罚金 ， 经 常会 根据 自前 一 次 铸币 检验 之 后 的 所 有 硬币 支付 现金 罚 
金 。 早 期 的 检验 处 罚 很 严厉 , 会 威胁 砍 断 厂 主 的 手 , 其 至 更 糟 。 此 外 ， 
硬币 太 重 也 是 个 问题 ， 它 们 会 被 滑 头 的 商家 们 从 流通 的 货币 中 挑 出 ， 
并 融 铸 成 金 锭 。 但 这 对 铸币 厂 毫 无 利润 可 言 ， 检 验 的 重点 在 于 硬币 
太 轻 。 

硬币 会 按 批 称 重 ， 这 可 能 反映 了 一 种 模糊 的 理解 : 个 体 硬 币 的 称 
重 需 要 付出 更 多 劳动 ， 误 差 比 例 也 会 变 得 更 大 。 比 如 ， 如 果 一 次 称 一 
dit 100 枚 金币 ， 目 标 显 然 是 1007。 那 公差 应 该 是 多 少 ” 他 们 的 选择 很 
有 启发 性 : 公差 在 这 种 情况 下 仅仅 是 100R。 只 有 这 批 硬币 的 重量 小 于 
1007 -100R 时 ， 才 意味 着 铸币 厂 未 能 通过 检验 。 但 现代 统计 学 告诉 我 
们 , 这 种 观点 错 了 。 这 个 条 件 对 铸币 厂 太 过 慷慨 。 这 个 标准 如 此 之 低 ， 
精明 的 铸币 厂 厂 主 会 放 低 目标 , 比如 将 硬币 的 铸造 目标 设 为 7 —0.5R, 
甚至 7-0.8R, 事实 上 也 不 会 有 测试 失败 的 风险 。 如 果 硬 币 的 重量 变化 
是 独立 的 (个 体 硬币 的 变化 在 统计 上 彼此 无 关 )， 对 一 批 100 枚 硬币 ， 
合适 的 公差 是 10R 而 不 是 100R。 统 计 上 独立 的 硬币 重量 的 变化 会 随 着 
个 数 的 平方 根 增 加 。 独 立 变化 是 个 朴素 的 假设 ， 给 出 的 结果 也 确实 更 
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接近 事实 ， 而 不 接近 100R。1866 年 的 一 些 数据 说 明 ， 单 个 硬币 的 公 
差 大 约 设 定 为 两 倍 的 标准 差 ， 这 意味 着 一 批 100 枚 硬币 的 公差 错误 地 
设 定 为 距离 目标 20 个 标准 差 。 一 些 试验 会 涉及 1000 个 甚至 更 多 硬 
币 的 称 重 ,铸币 厂 的 测试 结果 可 以 满足 任何 官僚 机 构 希 望 的 安全 标准 ， 
哪怕 他 们 的 目标 比 了 - 尺 还 高 一 点 。 

19 世纪 的 一 次 英国 议会 调查 中 ， 皇家 铸币 厂 的 官员 受到 了 “是 否 
降低 了 铸币 标准 ”的 质问 ， 而 他 们 让 调查 者 相信 自己 从 来 都 没 做 过 此 
类 行为 ， 尽 管 他 们 相信 法 国人 会 这 么 干 。 当 然 ， 在 铸币 检验 试验 的 
最 初 几 年 ， 即 使 最 优秀 的 数学 家 也 不 会 知道 今天 称 为 “ 根 号 规则 ” 
的 知识 ， 其 中 n 是 硬币 个 数 。 当 然 ， 有 一 位 铸币 厂 的 厂 主 比 普通 的 数 
学 家 更 加 杰出 : 艾 萨 克 ' 牛顿 。1696~1727 年 ， 他 先 任 铸造 厂 的 监管 ， 
接着 成 为 三 主 。1727 年 牛顿 去 世 , 留 下 了 一 笔 可 观 的 财富 。 但 很 明显 ， 
他 的 财富 归功 于 投资 之 道 ， 不 能 捕 风 捉 影 地 怀疑 他 发 现 铸币 厂 生 产 过 
程 中 的 缺陷 ， 并 利用 这 一 点 中 饱 私 宫 。 



















































































2.2 亚伯拉罕 棣 莫 弗 


直到 18 世纪 初 , 人 们 才 首 次 认识 到 , 数据 和 的 变化 并 不 随 着 相 加 
的 独立 项 个 数 成 比例 上 升 〈 并 且 均 值 的 标准 差 也 不 会 随 着 项 数 的 增加 
反比 例 减 少 ) 精度 信息 不 会 随 着 数据 的 增加 而 产生 线性 积累 , 这 种 新 
颖 的 观点 出 现在 18 世纪 20 年 代 ， 由 亚伯拉罕 ' 棣 莫 弗 提出 ， 当 时 他 
尝试 通过 大 量 试验 寻找 二 项 分 布 概率 计算 的 精确 方法 。1733 年 , 他 
的 尝试 产生 了 著名 结果 ， 即 现在 的 “二 项 分 布 的 正 态 近似 ”。 TTE 
1730 年 已 经 注意 到 ,分布 的 一 个 重要 特点 是 与 根 号 n 售 的 离 差 相关 。 
如 果 将 二 项 频率 函数 视 为 一 条 曲线 ， 拐 点 ( 可 以 认为 它 控制 着 散布 ) 
会 出 现在 tVn /2 的 区 间 内 。 
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这 个 含义 即使 对 于 棣 莫 弗 也 很 明确 。 他 在 关于 正 态 近似 的 第 5 个 
推论 中 提出 了 标准 差 ( 尽管 没有 命名 )， 在 The Doctrine of Chances 中 
稍 有 扩展 一 一 这 部 著作 的 拉丁 文 版 本 在 1738 年 首次 出 版 。 当 时 , ER 





弗 注 意 到 ， 对 于 大 的 n， 拐 点 之 间 区 间 的 总 概率 为 0.682688( 大 约 


28/41), TIF £n) /4 之 间 的 较 短 区 间 的 胜 败 机 会 相等 ( 如 图 2-1 
和 图 2-2 所 示 )。 无 论 选择 哪 种 确定 的 标准 ， 是 68% 还 是 50% (或 是 
90%, 95%, 或 者 如 同 最 近 希 格 斯 玻 色 子 的 发 现 , 大 约 99.9999998% ), 
估计 的 精度 都 根据 试验 个 数 的 平方 根 变动 。 





图 2-1 
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COROLLARY 5. 


And therefore we may lay this down for a fundamental Maxim, 
that in high Pewers, the Ratio, which the Sum of the Terms in- 
cluded between two Extreams diftant on both fides from the middle 
Term by an Interval equal to IV" bears to the Sum of all 
the Terms, will be rightly exprefs'd by the Decimal 0.682688, that 
is 5 nearly, 

Still, itis not to be imagin'd that there is any neceflity that the 
number z fhould be immenfely great ; for fuppofing it not to reach 
beyond the goo™ Power, nay noteven beyond the roo*, the Rule 
here given will be tolerably accurate, which I have had confirmed 
by Trials. : 

But it is worth while to obferve, that fuch a fmall part as is Vn 
in refpe&t to 7, and fo much the lefs in refpect to z as z increafes, does 
very foon give the Probability 2*. or the Odds of 28 to 13; from 





whence we may naturally be led to enquire, what are the Bounds- 


within which the proportion of Equality is contained ;. I anfwer, 
that thefe Bounds will be fet at fuch a diftance from the middle 


Term, as will be expreffed by 4v 2m very near; fo in the cafe 


above mentioned, wherein z was fuppofed — 3600, Van will 
be about 21.2 nearly, which. in refpe& to 3600, is not above 
-一 th part: fo that it is an equal Chance nearly, or rather fome- 
169 


thing more, that in 3600 Experiments, in each of. which an Event 
may as well happen.as.fail, the Excefs of the happenings or fail- 
ings above 1800 times will be no more than about zn 




















棣 英 弗 的 第 5 个 推论 , KA The Doctrine of Chances 第 二 版 。 
最 后 一 段 是 在 更 早 时 期 私下 传阅 的 1733 年 版 的 文本 基础 上 




















添加 的 (De Moivre 1738 ) 
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图 2-2 一 张 显 示 棣 莫 弗 两 个 拐点 的 图 片 (和 1730 年 讨论 的 一 样 )， 





7& JI E — IK n — 999 的 对 称 二 项 分 布 
世纪 40 年 代 
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凯特 勒 绘 于 19 


ln... 


Il jins eR 
450 hse 


1810 年 ， 皮 埃 尔 . 西蒙 ' 拉 普 拉 斯 证 明了 棣 莫 弗 结果 的 一 个 一 般 
形式 ,现在 称 为 “中 心 极限 定理 ”。 其 中 , 棣 莫 弗 已 经 推断 出 ， 二 项 分 
布 的 成 功 个 数 n 的 近似 变化 会 像 正 态 曲 线 。 拉 普 拉 斯 针对 观测 的 总 数 
或 均值 (比如 一 个 硬币 样本 的 重量 ) 得 到 了 同样 的 结论 ， 其 中 个 体 观 
W (或 者 观测 中 的 误差 ) 几乎 可 以 服从 任何 分 布 。 但 这 个 证 明 并 不 严 
谨 。1824 年 ， 西 莫 恩 ' 德 尼 : 泊 松 注意 到 一 个 例外 情况 ,我 们 现在 称 























为 “ 柯 西 分 布 "。 但 是 , 这 个 结论 对 广泛 的 情况 而 言 是 成 立 的 ， 并] 


学 家 们 迅速 注意 到 了 这 个 现象 。 
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图 2-3 
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SUPPLÉMENT AU MÉMOIRE 


Sur les approximations des formules qui sont 
PP 
fonctions de trés-grands nombres. 


Par M. LAPLACE. 


J fait voir dans l'article VI de ce Mémoire , que si 

l'on suppose dans chaque observation , les erreurs posi- 

tives et négatives également faciles; la probabilité que 

l'erreur moyenne d'un nombre 7 d'observations sera 
pum 


comprise dans les lini ya égale à 
2 Em M 
y aa ak 


A est l'intervalle dans lequel les erreurs de chaque ob- 
servation peuvent s'étendre. Si l'on désigne ensuite par 





9 (3) la probabilité de l'erreur = z , & est l'intégrale 
fdz. ex) étendue depuis z = — $ A, jusqu'à x 
—iAK est l'intégrale f 7. . dx. 9 (5 prise dans le 
méme intervalle: x est la demi-circonférence dont le 
rayon est l'unité, et c est le nombre dont le logarythme 
hyperbolique est l'unité. 


Supposons maintenant qu’un même élément soit donné 
par zt observations d'une première espèce, dans laquelle 

















拉 普 拉 斯 关于 中 心 极限 定理 的 第 一 次 清晰 表述 。 这 里 他 所 
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的 n 应 该 是 Vn (Laplace 1810 ) 











] 的 c 是 我 们 现在 常用 的 e。，KYk 表示 方差 .积分 表示 等 于 
F 均 误差 不 超过 给 定 限制 的 概率 ( 画 圈 的 部 分 ), 但 分 母 中 


讽刺 的 是 ， 第 一 次 出 版 的 拉 普 拉 斯 的 结果 中 有 一 个 打印 错误 ， 它 
Hin EET Jn (如 图 2-3 所 示 )。 两 年 后 图 书 付 梓 时 ， 这 个 错误 才 得 


以 纠正 。 





根 号 规则 的 含义 引 人 注 目 : 如 果 你 希望 一 项 研究 的 精度 翻 倍 , 双 























倍 的 努力 是 不 够 的 ,必须 增加 到 4 倍 的 努力 。 学 到 更 多 的 代价 比 通 常 的 
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看 法 要 费力 很 多 。 雅 各 布 ， 伯 努 利 以 名 著 《 猜 测 术 》( 4Ars conjectandi ) 
封 笔 ， 他 在 其 中 提 到 了 自己 的 发 现 ， 实 际 上 要 做 26 000 次 试验 才能 获 
得 他 认为 的 可 接受 精度 水 平 。 那 时 候 大 家 还 不 知道 根 号 规则， 而且 
他 也 不 可 能 知道 自己 寻找 的 精度 水 平 无 法 实际 实现 。 随 着 时 间 的 流逝 ， 
统计 学 家 不 得 不 接受 现实 ， 满 足 于 较 少 的 精度 ， 并 相应 调整 自己 的 期 
望 ， 同 时 继续 寻找 对 误差 或 方差 累积 的 更 好 理解 。 这 和 长 期 以 来 的 数 
学 实践 形成 了 直接 的 对 比 。 在 数学 运算 的 序列 中 ， 数 学 家 们 会 记录 每 
一 个 步骤 引起 的 最 大 误差 ， 这 个 量 会 随 着 序列 的 增长 而 增 大。 而 统计 
学 家 们 可 以 接受 一 个 可 能 的 误差 补偿 ， 相 对 来 说 ， 这 个 补偿 会 随 着 序 
列 的 增长 而 收缩 。 












































2.3 RE. S RE. eit 


这 个 规则 到 19 世纪 中 期 得 到 了 改进 。 英 国 天 文学 家 乔治 ， 艾 里 
1861 年 出 版 了 一 本 小 教材 ， 题 为 《观测 误差 与 观测 组 合 的 代数 与 数值 
理论 》 其 中 一 节 叫 作 “ 纠 缠 的 观测 ”。 “纠缠 的 ”意思 是 说 几 个 观测 有 
共同 的 部 分 ， 因此， 正如 我 们 现在 所 说 ， 是 相关 的 。 艾 里 确实 展示 了 
这 种 关系 对 估计 方差 的 影响 ,更 深 地 理解 了 相关 性 与 数据 信息 量 的 

美国 哲学 家 、 博 学 者 查 尔 士 . 皮尔 士 在 这 个 方向 上 走 得 更 远 。 他 
在 1879 年 发 表 了 一 份 简短 的 笔记 ， 内 容 关 于 他 所 谓 的 “经 济 研 究 理 
论 "。 皮 和 尔 士 这 样 描述 自己 的 目标 ,“ 一 般 来 说 ， 经 济 原则 处 理 效用 和 
成 本 之 间 的 关系 。 经 济 学 的 研究 分 支 关 心 的 是 ,减少 可 能 的 知识 偏差 
的 成 本 效应 关系 。 主 要 问题 是 ， 给 定 了 人 金钱、 时间 和 能 量 的 花费 ， 如 
何 使 知识 得 到 最 有 价值 的 增加 。” 

皮尔 士 将 其 视 为 一 个 效用 理论 的 问题 : 考虑 标准 差 不 同 的 两 个 实 
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Jo, 都 是 艾 里 考虑 过 的 混合 类 型 (本 质 上 是 方差 成 分 模型 ), 它们 两 个 
都 提供 了 要 紧 的 信息 ， 关 键 是 你 如 何 优化 自己 的 努力 。 在 一 个 测量 重 
力 的 可 倒 摆 试验 的 具体 例子 中 ， 你 该 如 何 分 配 摆 锤 向 上 停顿 和 向 下 停 
顿 之 间 的 时 间 ? 这 是 一 个 优化 问题 ， 很 明显 ， 其 中 的 优化 规则 度量 了 
相关 观测 的 获取 信息 。 皮 尔 士 认为 ， 这 个 试验 需要 以 相同 时 间 周 期 针 
对 每 个 位 置 进行 ， 而 且 ， 试 验 的 持续 时 间 还 需要 “与 支撑 点 到 质心 的 
距离 成 比例 ”。 他 以 这 样 的 忠告 作为 笔记 的 结束 语 :“ 需 要 注意 ， 这 里 
给 出 的 理论 依据 假定 了 研究 目的 在 于 发 现 真相 。 而 如 果 一 项 研究 是 出 
于 实现 个 人 坏人 誉 的 目的 来 做 的 话 ， 这 个 问题 的 经 济 学 就 会 完全 不 同 。 
但 这 也 可 以 很 好 地 理解 那些 人 为 什么 会 投入 这 种 研究 类 型 ”这 种 评论 
讽刺 的 对 象 大 概 不 难 对 号 入 座 。 

无 论 如 何 , 直到 20 世纪 才 明 确 建立 这 种 思想 ; 数据 中 的 信息 可 以 
度量 ， 其 精度 在 某 种 程度 上 与 数据 的 数量 有 关 ， 在 某 些 情况 下 能 够 精 
确 处 理 。 不 过 并 不 能 预 设 这 种 思想 不 曾 受 到 挑战 。 可 以 想象 , 许多 人 
仍然 相信 第 二 组 20 个 观测 与 前 20 个 至 少 一 样 有 价值 。 但 一 些 权 威 还 
有 另 一 个 有 趣 的 说 法 ， 这 个 说 法 更 为 极端 地 走向 了 相反 的 观点 。 它 认 
为 ， 如 果 你 有 两 个 观测 ， 那 么 舍弃 一 个 要 好 于 取 两 者 的 均值 ! 而 且 更 
糟糕 的 是 ， 这 种 观点 居然 正确 ! 
牛津 的 逻辑 学 家 约翰 . 维 恩 在 1878 年 的 《普林斯顿 评论 》 上 发 表 
了 一 篇 文章 , 设想 了 这 样 的 情况 : 一 位 舰 长 计划 夺取 敌人 的 一 座 要 塞 ， 
他 派 了 两 名 间谍 潜入 要 塞 ， 并 要 求 其 返回 报告 要 塞 中 加 农 炮 的 口径 ， 
如 此 就 可 以 准备 尺寸 合适 的 加 农 炮弹 ， 以 确保 夺取 要 塞 后 可 以 加 强 防 
守 。 一 名 间谍 报告 口径 是 8 英寸 , 另 一 名 报告 是 9 英寸 ,那么 舰 长 应 
该 配置 8.5 英寸 的 加 农 炮弹 吗 ? 当然 不 会 ， 无 论 哪 种 情况 ， 这 个 炮弹 
都 不 能 用 。 哪 怕 扔 硬币 决定 取 两 种 尺寸 中 的 某 一 种 ， 都 好 过 注定 失败 
的 平均 值 。 
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问题 在 于 标准 化 分 析 ,这 种 分 析 隐 藏 于 本 章 所 有 其 他 例子 的 背后 ， 
都 默认 了 假定 精度 的 恰当 度量 是 均 方 根 误差 ， 或 是 它 常 用 的 蔡 代 方 
式 一 一 估计 的 标准 差 。 如 果 观 测 是 围绕 目标 值 的 正 态 分 布 ， 那 么 精度 
的 所 有 合理 度量 都 会 一 致 ， 并 与 均 方 根 误差 相 一 致 。 但 维 恩 的 例子 并 
不 属于 这 种 类 型 。 他 的 例子 中 ， 残 差 超 过 这 个 闭 区 间 时 ， 佑 计 的 惩罚 
不 增加 ， 因 此 这 个 区 间 越 紧密 ， 产 生 的 成 本 会 越 高 。 对 维 恩 来 说 ， 合 
适 的 度量 是 估计 值 落 在 目标 旁 非常 小 的 数字 e 邻 域内 的 概率 。 用 于 估 
计 口 径 c 的 佑 计 值 5 的 选择 是 要 最 大 化 Prob{IB8 -C| <e} HB 
Er 埃 奇 沃 思 对 此 表示 赞同 ， 在 1883 年 的 一 份 简短 笔记 中 ， 他 表示 ， 
这 种 解决 方案 “ 扔 掉 了 一 个 随机 选择 的 观测 ”， 除 了 维 恩 离散 案例 的 
某 些 情况 ， 一 般 优 于 均值 。 对 于 那些 表现 出 矛盾 的 误差 分 布 ， 甚 至 一 
些 所 有 和 矩 都 有 限 的 连续 单 峰 密度 的 误差 分 布 , 埃 奇 沃 思 给 出 了 一 类 例 
T. 与 通常 的 情况 相 比 ， 它 们 在 众 数位 置 更 尖 ， 但 也 不 总 是 如 此 。 很 
明显 ， 信 息 的 度量 需要 关注 研究 目的 。 

在 20 世纪 其 他 更 平凡 的 例子 中 ， 根 号 规则 的 失效 吸引 了 关注 。 
有 一 类 是 时 间 序 列 模型 ， 其 中 的 序列 相关 性 产生 了 明显 的 模式 ， 欺 骗 
了 数据 分 析 者 ， 除 非 你 意识 到 序列 相关 减少 了 有 效 的 样本 规模 ， 使 其 
远 低 于 画 出 的 点 数 。 这 会 导致 错误 地 发 现 周期 性 。 如 果 只 研究 了 有 限 
的 几 次 循环 ， 即 使 非 周期 的 机 制 也 会 表现 出 周期 性 。20 世纪 80 年 代 ， 
两 位 著名 的 地 理学 家 发 现 了 地 球 上 小 型 海洋 生命 灭绝 率 中 一 个 2600 
万 年 周期 的 证 据 。 如 果 这 个 证 据 成 立 ， 它 预示 存在 着 地 球 之 外 的 某 些 
原因 。 有 一 种 假设 是 ， 我 们 的 太阳 有 一 个 伴星 ， 现 在 观察 不 到 它 ， 但 
每 隔 2600 万 年 就 向 我 们 发 出 辐射 。 

这 个 假设 掀起 了 人 们 的 狂热 兴趣 , 还 登 上 了 《时 代 周 刊 》 的 封面 ， 
热切 的 科学 家 们 立刻 投入 到 寻找 其 他 统计 证 据 的 工作 中 。 寻 找 就 能 找 
到 ”的 观点 在 不 受 控制 的 数据 分 析 中 发 挥 了 巨大 作用 ， 许 多 论文 得 到 















































































































































第 2 信息 : 度量 与 变化 率 | 33 





























发 表 ， 声 称 有 一 个 类 似 于 地 球 磁场 的 逆转 周期 ， 和 其 他 尚 不 清晰 的 周 
期 。 最 后 ， 人 们 证 明 , 在 灭绝 率 中 发 现 的 第 一 个 信号 确实 稍 有 周期 性 ， 
但 原因 是 数据 的 人 工 处 理 ， 而 不 是 一 颗 路 过 的 死 星 。 这 个 数据 为 过 去 
2 亿 5000 万 年 间 地 质 纪 元 的 测定 提供 了 线索 。 对 这 一 半 时 期 来 说 ， 纪 
元 已 经 很 好 地 确定 下 来 ， 但 不 包括 时 间 。 这 个 时 间 线 的 提出 者 只 好 将 
这 一 段 1 亿 2500 万 年 的 时 间 划 分 为 20 个子 区 间 ， 每 个 子 区 间 的 平均 
长 度 为 625 万 年 。 但 端点 的 分 数 表达 会 夸大 精度 ， 因 此 他 们 把 这 个 周 
期 分 割 成 长 度 为 6、6、6、7、6、6、6、7、6、6、6、7、6、6、6、7、 
6、6、6、7 的 片段 。 这 个 人 工 周期 在 分 析 中 发 挥 了 作用 ， 给 出 了 周期 
性 的 表象 ， 引 爆 了 最 初 的 激情 。 

尽管 所 有 测量 的 精度 都 相同 ， 但 最 后 10 个 测量 的 价值 远 不 及 前 
10 个 ， 这 就 是 信息 积累 的 悖 论 ， 并 因为 统计 和 科学 中 “信息 ”术语 的 
不 同 使 用 方式 而 增强 ( 还 有 某 种 程度 的 误导 ), 一 个 合适 的 例子 是 统计 
理论 中 的 术语 “ 费 舍 尔 信息 量 ”。 在 参数 估计 问题 的 最 简单 形式 中 , 费 
EIEEE X09) 是 得 分 函数 平方 的 期 望 值 ， 定 义 为 数据 概率 密度 函数 
对 数 的 导数 ， 即 I(0)-E[dlogf£(X3, X», X, 0yd0 Fo (EIME, An 
果 数 据 概率 迅速 地 随 着 0 改变 , 这 个 导数 趋 于 变 大 ,那么 概率 对 于 0 越 
敏感 ， 数 据 中 的 信息 就 越 丰富 。) 这 是 一 种 非凡 的 统计 构造 , 在 非常 广 
泛 的 适用 条 件 下 ， 它 的 倒数 给 出 了 所 能 找到 的 方差 的 最 佳 估 计 。 对 于 
这 些 情况 下 通过 聚合 可 以 获得 的 结果 , 它 设 定 了 一 个 黄金 标准 。 但 从 评 
佑 信息 积累 的 角度 看 ， 它 有 误导 ， 因 为 它 使 用 了 错误 的 单位 表达 一 一 
一 个 平方 单位 的 尺度 。 这 是 一 种 附加 的 度量 ， 并 且 可 以 说 ， 等 长 的 数 
据 片 段 具 有 等 量 的 信息 。 费 舍 尔 信息 量 和 根 号 n 规则 是 一 致 的 ,使 用 
时 只 要 取 平 方 根 即 可 。 

20 世纪 40 年 代 ， 克 劳 德 香农 提出 了 另 一 种 信息 的 附加 度量 。 
香农 关心 一 个 相当 不 同 的 问题 一 一 编码 和 信和 号 处 理 问题 。 在 这 个 问题 
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里 ， 他 把 下 面 这 一 点 看 作 不 证 自明 的 : 因为 传送 的 信号 没有 限制 ， 并 
且 在 传递 过 程 中 经 过 编码 成 为 等 信息 量 的 ， 因 此 信息 度量 是 可 加 的 。 
统计 学 家 考虑 的 自然 和 人 文科 学 问题 中 ， 可 加 性 仅 在 数据 集 规模 非 线 
性 的 尺度 上 成 立 。 

评估 信息 积累 是 一 项 相当 复杂 的 任务 ,但 通过 仔细 关注 相关 性 和 
科学 目标 ,数据 的 信息 度量 一 一 不 同 信息 集中 的 比较 信息 和 随 着 数据 
增长 而 产生 的 信息 增长 率 一 一 已 经 成 为 统计 学 的 一 根 支 柱 。 
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似 然 : EKRE Epist 





没有 背景 的 测量 只 是 一 个 数字 ， 没 有 意义 的 数字 。 背 景 提供 了 尺 
度 ， 可 帮助 校准 ， 并 允许 比较 。 当 然 ， 我们 每 天 都 会 看 到 没有 背景 的 
数字 ， 比 如 报纸 上 的 一 个 常见 栏目 叫 作 “数字 事实 ”, 会 列举 一 些 试图 
震惊 或 娱乐 读者 的 例子 。 即 便 高 高 在 上 的 《科学 》 杂 志 也 使 用 过 这 种 
手段 ， 有 一 个 条 目 (2011 年 8 月 5 日 ) 这 样 说 : 








42 000 根据 PLoS ONE 上 的 一 项 研究 ， 世 界 上 有 42 000 
名 儿童 死 于 腹腔 疾病 。 

















表面 上 看 ,这 个 统计 数字 令 人 不 安 。 但 果真 如 此 吗 ? 多 长 时 间 的 ? 

一 周 、 一 年 还 是 20 年 ? 这 个 数字 是 大 还 是 小 ?毕竟 世界 上 有 70 亿 人 
O, 其 中 儿童 大 约 有 20 亿 。 有 全 球 儿童 的 其 他 死亡 原因 的 数字 可 参照 
吗 ? 不 同 国家 的 疾病 流行 程度 一 样 吗 ?而且 ，42 000 是 一 个 很 整 的 数 
字 , 肯 定 不 精确 ,那么 可 能 的 误差 是 多 少 ? 10% 还 是 50%? 可 能 是 10096 
吗 ? 进一步 研究 PLoS ONE 可 以 找到 一 些 答案 ， 也 能 发 现 有 点 乱 。 给 
出 的 数字 是 年 度数 字 ， 但 仅仅 是 根据 一 个 数学 模型 推测 出 来 的 数字 ， 

这 个 模型 是 想 估 计 未 确诊 人 数 等 其 他 数据 的 。 并 且 ， 这 个 条 目 所 引 的 
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文章 中 没 说 “有 42 000 人 死亡 ”， 而 是 说 “42 000 人 可 能 死亡 ”， 这 
两 种 说 法 非常 不 同 。 这 个 数字 也 不 是 基于 数据 给 出 的 , EE, PLoS 
ONE 的 文章 提醒 过 读者 ， 当 前 “严重 缺乏 有 全 球 代表 性 的 流行 病 学 妆 
据 ”。 它 通过 模型 试探 发 现 了 一 个 取 值 范围 (+15% ), 但 没有 说 明 模 型 
失败 导致 的 范围 。PLoS ONE 给 我 们 提供 了 背景 ， 但 《科学 》 不 仅 没 
有 这 人 么 做 ， 而 且 还 严重 地 误导 了 我 们 。 

测量 只 有 用 于 比较 才 是 有 用 的 。 背 景 提 供 了 比较 的 基础 ， 或 是 一 
条 基线 、 一 个 基准 ， 或 是 一 组 用 于 相互 比较 的 测量 。 有 时 基线 是 隐 含 
的 、 基 于 常识 的 ， 比 如 报告 当天 天 气 时 ,会 自然 地 联系 到 本 地 的 知识 
和 过 去 的 经 验 。 但 更 常见 的 情形 一 一 比如 源 于 腹腔 疾病 的 儿童 死亡 情 
况 一 一 缺乏 一 般 的 和 常识。 并且 无 论 如 何 ， 科 学 需要 更 多 基线 : 真实 的 
数据 、 明 确 的 来 源 ， 以 及 衡量 差异 水 平 的 测量 尺度 。 这 种 差异 是 显著 
的 还 是 不 显著 的 ? 

常规 物理 测量 的 最 早 的 一 个 例子 ， 是 第 2 章 讨论 过 的 铸币 检验 试 
验 。 该 试验 中 , 即使 从 最 开始 算 起 一 一 大 约 公 元 1100 年 一 一 也 由 契约 
给 出 了 重量 的 基线 ， 这 是 一 种 契约 基线 。 试 验 托 板 给 出 了 金属 成 色 方 
面 的 基线 ， 一 个 托 板 样品 现在 还 保存 在 伦敦 塔 中 。 铸 币 检验 试验 也 有 
一 个 评价 差异 的 尺度 “公差 ”， 给 出 了 我 们 今天 称 为 “容忍 度 ” 的 
概念 。 它 通过 谈判 得 出 ， 但 没有 迹象 表明 ， 它 是 以 任何 正式 的 方式 从 
数据 导出 的 ， 或 来 自 于 铸币 过 程 变化 性 的 正式 评价 。 并 且 ， 我 们 注意 
到 ， 有 一 种 缺陷 妨碍 了 它 的 运用 。 



















































































3.1 阿布 斯 诺 特 和 显著 性 检验 


现代 统计 学 使 用 “概率 度量 ”作为 差异 评价 的 基本 组 成 部 分 ， 它 
通常 按照 统计 检验 的 形式 ， 其 根源 可 以 追溯 到 几 个 世纪 之 前 。 检 验 的 
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结构 问题 看 起 来 简单 而 直接 : 对 一 种 理论 或 者 假设 ， 手 边 的 数据 是 支 
持 它 还 是 否定 它 ?“ 似 然 ” 的 概念 是 回答 这 个 问题 的 关键 , 因此 它 不 可 
避免 地 涉及 了 统计 检验 的 构造 。 检 验 的 问题 会 通过 比较 不 同 假设 下 的 
数据 概率 进行 回答 。 最 早 的 例子 中 只 计算 一 个 概率 ， 并 隐 了 睡 地 进行 
比较 。 

约翰 阿布 斯 诺 特 作为 一 位 极 具 鼓 动 性 的 作家 而 家 喻 户 晓 ， 他 
1712 年 出 版 了 一 部 讽刺 文学 作品 ， 题 为 Law Is a Bottomless Pit, 其中， 
阿布 斯 诺 特 创 造 了 “约翰 牛 ” 这 个 典型 的 英国 人 形象 。 阿 布 斯 诺 特 是 
乔纳森 ' 斯 威夫 特 和 亚历山大 : 薄 柏 的 密友 。 薄 柏 给 他 的 朋友 写 过 一 
封 信 , 也 是 一 篇 著名 的 讽刺 文章 一 一 《 致 阿布 斯 诺 特 的 一 封 信 》 他 在 
信 中 批评 约瑟夫 ' 爱迪生 时 ， 引 入 了 短语 “明仁 实 几 ”( damn with faint 
praise )。 阿 布 斯 诺 特 也 接受 过 数学 和 医学 的 训练 ( 1705~1714 年 作为 
私人 医生 为 安妮 女王 服务 ), 作为 数学 家 , 他 有 过 两 个 著名 的 贡献 。 第 
一 个 贡献 是 1692 年 出 版 的 概率 小 册子 ， 大 部 分 是 克里斯蒂 安 ， 惠 更 斯 
1657 年 出 版 的 拉丁 文 小 册子 的 翻译 , 但 这 本 书 是 该 主题 的 最 早 的 英文 
出 版 物 之 一 。 第 二 个 贡献 是 他 于 1710 年 在 伦敦 皇家 学 会 宣读 的 一 份 简 
短 笔 记 ， 随 后 发 表 在 学 会 的 《学 报 》 上 。 笔 记 标 题 是 “对 于 神圣 天 意 
的 一 个 论点 一 一 来 自 两 性 出 生 率 恒定 规律 的 观察 ”。 直 到 今天 , 这 份 笔 
记 依 然 作 为 显著 性 检验 的 早期 经 典 例子 被 大 量 引用 。 

阿布 斯 诺 特 认为 ,现在 观察 到 的 男性 CM ) 和 女性 CF) 人 数 的 平 
衡 ， 原 因 不 是 概率 ， 而 必然 是 神圣 天 意 的 结果 。 原 因 有 二 : 第 一 ， 用 
数学 语言 来 说 ， 如 果 像 投掷 一 枚 公平 的 双边 蜗 子 那样 设计 性 别 ， 那 么 
极 不 可 能 得 到 精确 的 平衡 结果 (或 者 即使 是 非常 接近 的 平衡 ) 他 计算 
了 两 个 人 的 性 别 精确 平衡 的 概率 ( 即 两 个 人 成 为 MF 或 FM 的 概率 ， 
就 是 1/4+1/4=1/2 )，6 个 人 的 概率 是 20/64=0.3125， 以 及 10 个 人 的 
是 63/256 < 1/4。 他 同时 表示 , 通过 对 数 可 以 将 这 种 计算 运用 于 人 数 很 
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大 的 情形 。 很 明显 ， 结 果 会 得 到 一 个 非常 小 的 概率 。 所 有 这 些 计算 都 
正确 , 将 一 枚 公平 的 硬币 投 撕 2n 次, 正 反面 个 数 会 恰好 平衡 的 机 会 近 
似 为 c/ Vn ， 其 中 c= VQ277) 20.8, ， 如 表 3-1 所 示 。 

阿布 斯 庄 特 使 用 较 低 的 精度 ， 并 且 声称 ， 即 使 将 平衡 的 定义 从 精 
确 平衡 放宽 到 近似 平衡 , 这 种 概率 依然 很 小 。 在 那样 的 情况 下 ,“ 近 似 
C approximate ) 意味 着 什么 ”这 样 的 问题 就 非常 关键 , 而 且 做 这 个 计算 
需要 的 数学 在 未 来 若干 年 之 后 才 出 现 。 但 无 论 如 何 ， 他 表达 的 这 第 二 
个 观点 终于 使 其 留 名 青史 。 




















表 3-1 硬币 投掷 次 数 与 精准 平衡 的 概率 关系 





投掷 次 数 精确 平衡 的 概率 
2 0.50 

6 0.31 

10 0.25 

100 0.08 

1000 0.025 

10 000 0.008 


在 长 达 82 年 的 死亡 率 报表 (bills of mortality ) 中 ， 阿 布 斯 诺 特 检 
查 了 出 生男 性 相对 于 出 生 女 性 的 超额 数量 ( 如 图 3-1 所 示 )。 他 发 现 ， 
这 样 一 种 运行 机 制 会 发 生 的 概率 只 有 1 : 2”， 小 到 可 以 忽略 : 

1/4 836 000 000 000 000 000 000 000。 

这 里 的 “随机 分 布 ” 一 一 即 对 每 种 情况 独立 地 指派 相等 概率 的 性 
别 一 一 与 神圣 天 意 的 结果 比较 后 ， 这 种 假设 对 这 些 数据 中 男性 多 于 女 
性 给 出 了 更 大 的 概率 。 为 什么 呢 ? 因为 存在 这 样 一 些 观点 : 考虑 到 
“那些 必须 冒险 寻找 食物 的 ) 男性 主体 面临 着 外 部 的 意外 ”, “大 自然 
极 富 远 见 ， 它 的 创造 者 聪明 又 割 智 ， 经 过 他 的 处 置 ， 创 造 出 的 男性 比 
女性 更 多 ， 而 且 比 例 接 近 常 数 "。 阿 布 斯 诺 特 没有 计算 这 种 选择 。 
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Chriftened. | Chriftened. 
Anno. | Males. | Females. Anno. | Males. | Females. 
1629 ` 5218 | 468; 1648 | 3363 | 3181: 

go | 4858 | 4457 | 49 ( 3979 | 2746 
31 | 4422 ] 4102 50 | 2890 | 2722 
33 | 4994 | 4590 | $1 | 3231 | 2840 
33 | 5158 | 4839 | 52 | 3220 | 2908 
84] 5035 | 4820 | [ 53 | 3196 | 2959 
35 | 5106 | 4928 | 54 | 3441 | 3179 
36 | 4917 | 4605 55 | 3655 | 3349 
37 | 47e3 | 4457 | $6 | 3668 | 3382 
38 | $359 | 4952 57 | 3396 | 3289 
39 | 5366 | 4764 | | 58 | 3157 | 3013 
40 | 5518 | 5332 $9 | 3209 | 2781 
41! 5470 | 5200 6o | 3724 ! 3247 
42 | $460 ! 4910 61 1 4748 | 4197 
43 | 4793 ， 4617 62 | 5216 | 4803 
44 | 4107 | 3997 ， 63 | 5411 | 4881 
45 | 4047 | 3919 64 | 6o4 | 5681 
46 3768 3395 | 65 pr pur 
431 
TOUR S 233 Bb Chriftened, 
Chriftened. Chriftened; 
Anno. | ,iales. | Fewales, 1 Ano. j Males. | Females. 
1667: | 5616 | 5322 | 1689 | 7604 | 7167 
68 | 6073 | 5560 9o | 7999 | 7302 
69 | 6556 |. 5829 91 | 7662 | 7392 
70 | 6278 | 5719 | 92 | 7602 | 7316 
71 | 6449 | 6o6 93 | 7676 | 7483 
72 1 6443 | 6120 94 | 59805 ， 6647 
73 | 6073 | 5822 | 95 | 7263 | 6713 
74 | 6113 | 5738 96 | 7632 | 7229 
75 | 6o58 | 5717 || 97 | #062] 7767 
76 | 6552 | 5847 98 | 8426 | 7626 
77 | 6423 | 6203 || 99 | Terr | 7452 
78 | 6568 | 6033 1700 | 7578 | 7061 
79 | 6247 | 6041 1701 | 8102 | 7514 
So | 6548 | 6299 1702 | 8031 7656 
81 | 6822 | 6533 1703 zs | 7683 
82 | 6909 | 6744 [oss | 6113 | 5738 
83 | 7577 | 7158 1705 | 8366 | 7779 
84 | 7575 | 7127 1706 | 7952 | 7417 
85 | 7484 |. 7246 1707 | 8379 | 7687 
86 | 7575 | 7119 1708 | 8239 1 7523 
87 | 7737 | 7214 | 1709 | 7840 | 7380 
88.| 7487 | 7101 1710 | 7640 | 7288 














HUE, FHER * 伯 努 利 发 表 于 1735 年 的 一 份 有 奖 征文 中 ， 考 察 
f dede du e i 


接近 程度 。 








这 6 个 轨道 平面 并 非 完美 一 致 ， 但 它们 都 落 在 一 个 很 小 的 








角度 差异 中 : 


轨道 平面 的 相互 倾斜 都 在 6554' 之 内 。 伯 努 利 判断 ,在 随 
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机 分 布 的 假设 下 ， 这 种 接近 的 一 致 性 极 不 可 能 被 接受 。 他 的 一 个 计算 
中 ,将 6°54 取 作 近 似 90° 的 113。 并 且 ， 他 判断 其 他 5 颗 行星 位 于 一 
个 给 定 的 、 和 包含 地 球 轨道 的 6°54' 区 间 内 的 概率 是 (1/13)” = 1/371 293。 
伯 努 利 认为 ， 这 给 出 了 才 括 所 有 轨道 平面 需要 的 最 小 角度 。 

阿布 斯 诺 特 和 伯 努 利 都 对 数据 集 设置 了 概率 尺度 ， 特 别 在 本 质 上 
都 使 用 了 后 来 罗 纳 德 A. 费 舍 尔 逻 辑 分 明 地 提出 的 原则 :“ 这 个 推断 的 
支持 力量 在 逻辑 上 出 于 一 种 简单 的 分 离 : 要 么 发 生 了 一 个 很 少见 的 机 
会 ,要么 随机 分 布 的 理论 不 是 真 的 。” 如 果 数 据 不 是 随机 分 布 的 结果 ， 
那么 某 些 其 他 的 规则 必然 起 作用 。 阿 布 斯 诺 特 和 伯 努 利 的 例子 中 ， 似 
然 的 比较 是 大 家 默认 的 。 至 少 一 个 其 他 假设 ( 神圣 天 意 或 牛顿 力学 ) 
会 导致 观测 数据 发 现 的 概率 会 高 于 在 “概率 ”假设 之 下 发 现 的 概率 ， 
大 家 认为 这 是 理所当然 的 。 

比较 问题 还 简单 时 ， 只 需要 考虑 两 个 不 同 的 概率 ， 答 案 也 比较 简 
单 : 计算 一 个 概率 ， 如 果 它 非常 小 ， 就 推断 另 一 个 概率 。 乍 一 看 ， 阿 
布 斯 诺 特 和 伯 努 利 的 问题 就 属于 这 种 类 型 ,但 即使 如 此 也 出 现 了 困难 。 
阿布 斯 诺 特 认为 平衡 无 需 精确 ,只 需 近 似 时 , 发 生 了 他 的 第 一 个 讨论 。 
这 带 来 的 问题 是 ， 近 似 的 程度 怎样 才 足 够 好 ?因此 ， 他 转向 伦敦 的 出 
生 数 据 。 根 据 这 些 数据 ,他 发 现 了 82 年 间 出 生 的 男性 多 于 女性 , 并 就 
此 计算 了 一 个 概率 ， 给 出 了 “其 他 ”的 推断 。 阿 布 斯 诺 特 的 计算 具备 
了 现代 检验 的 一 些 要 素 ， 但 它 仅 仅 处 理 了 一 种 极端 情况 : 在 可 获得 的 
82 年 样本 中 的 每 一 年 ， 出 生 的 男性 都 超过 女性 。 如 果 82 年 中 只 有 81 
年 发 生 这 种 超额 , 他 会 做 什么 ?他 会 在 一 个 概率 假设 下 评估 82 年 中 有 
81 年 发 生 的 精确 概率 吗 ? 又 或 者 ( 就 像 现代 检验 通常 会 做 的 )， 他 会 
发 现 82 年 中 至 少 发 生 81 年 的 概率 吗 ? 这 两 个 概率 都 很 小 ， 但 是 更 中 
间 的 情况 如 何 ? 比如 82 年 中 发 生 60 年 ， 或 者 82 年 中 有 48 年 出 生 的 
男性 超过 女性 的 情况 ， 其 中 不 同 的 方法 会 产生 非常 不 同 的 答案 吗 ? 他 
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会 怎样 做 ， 我 们 不 得 而 知 。 

如 果 数 据 记 录 在 连续 的 尺度 〈 或 近似 连续 的 尺度 ) 上 ， 这 个 问题 
会 更 严重 。 所 以 在 最 合理 的 假设 之 下 ， 每 个 数据 值 都 有 一 个 小 概率 。 
出 生性 别 可 能 性 均等 的 总 体 中 ， 每 种 性 别 决定 都 独立 时 ， 如 果 有 
1 000 000 人 出 生 ， 那 么 出 生 的 男性 个 数 多 于 女性 的 概率 不 可 能 大 于 
1/1000。 这 是 否 意 味 着 我 们 拒绝 了 一 种 自然 随机 平衡 的 假设 ， 即 对 每 
种 性 别 数据 显示 一 种 完美 相等 的 个 体 数量 ? 很 明显 ， 单 个 的 概率 计算 
并 不 是 所 有 问题 的 答案 。 概 率 本 身 是 一 种 度量 ， 因 此 需要 一 个 比较 的 
基础 。 显 然 ， 也 需要 在 可 允许 的 假设 上 施加 一 些 约束 ， 否 则 这 种 “ 数 
据 天 定 ” 的 自我 实现 的 假设 会 对 任何 数据 集 给 出 为 1 的 概率 。 
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并 非 所 有 似 然 观 点 都 以 数值 精确 表示 。 一 个 著名 的 例子 是 大 卫 . 
休 议 对 基督 教 神学 某 些 基本 原则 发 表 的 看 法 。1748 年 ， 休 谍 发 表 了 论 
文 《 论 神 迹 》 这 篇 文章 其 实 早已 完成 , 但 他 希望 该 文 能 产生 友 动 ， 因 
此 推迟 了 发 表 。 休 议 主 张 ， 不 应 该 信任 那些 以 基督 复活 作为 主要 例子 
所 报告 的 神 迹 。 他 把 神 迹 描述 为 “自然 法 则 的 违 逆 ”, 因此 更 是 极 不 可 
能 发 生 的 。 事 实 上 ， 这 些 基 督 复 活 的 神 迹 也 的 确 不 可 能 ， 报 告 者 要 么 
撤 了 议 ， 要 么 搞 错 了 ， 相 比 之 下 ， 那 些 个 不 准确 的 神 迹 报告 倒 像 是 更 
有 可 能 的 。 

休 谎 准确 预料 到 会 有 一 场 论 战 ， 但 没 能 预计 到 其 中 一 种 回应 的 数 
学 特征 。 那 时 ， 也 许 是 作为 对 休 让 的 回应 ,托马斯 * 贝 叶 斯 至 少 写 出 
了 他 的 著名 论文 中 的 精彩 部 分 。 无 论 如 何 ， 在 1764 年 早期 ， 理 查 德 
普 莱 斯 考虑 出 版 贝 叶 斯 的 论文 时 ， 训 不 犹豫 地 认为 论文 的 目的 是 回应 
休 议 的 论文 。 直 到 最 近 大 家 才 注 意 到 ， 普 莱 斯 为 贝 叶 斯 的 论文 拟定 的 
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标题 (很 可 能 也 是 贝 叶 
推断 的 精确 概率 的 一 种 方法 》( 如 
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斯 的 意思 ) 一 一 《建立 在 归纳 基础 上 计算 所 有 
图 3-2 所 示 ) 这 个 标题 的 野心 太 大 ， 


还 没有 文本 可 以 完全 证 明 。 这 篇 文章 对 此 问题 给 出 了 一 种 数学 处 理 : 
如 果 一 个 事件 在 n 次 独立 试验 的 每 次 都 以 未 知 的 概率 p 发 生 ， 并 且 发 





























图 3-2 
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茉 斯 选 定 的 贝 叶 斯 论文 单行 本 标题 页 ( Watson 2013 ) 


MERET xK, 那么 在 p 的 所 有 值 等 可 能 的 先 验 假设 之 下 ， 寻 找 p 
的 后 验 分 布 。 这 是 贝 叶 斯 定理 首次 出 现 的 特殊 形式 ， 并 且 ， 正 妇 
打下 一 本 重要 出 版 物 所 表明 的 ， 他 是 冲 着 休 谨 来 的 。 





UAE 





第 3 章 (UR. 概率 尺度 上 的 校准 | 43 























1767 年 ， 普 莱 斯 的 书 Four Dissertations 问世 ， 书 中 一 部 分 在 一 个 
很 有 炉 动 性 的 标题 下 明确 引用 了 贝 叶 斯 的 论文 ， 直 接 反 驳 了 休 席 。 它 
包括 了 普 莱 斯 的 贝 叶 斯 定理 应 用 ( 贝 叶 斯 论文 以 外 的 最 早 应 用 ), 一 个 
详尽 计算 表明 了 反对 那些 被 视 为 自然 法 则 的 内 容 一 一 并 不 像 休 谎 所 主 
张 的 那样 。 休 廊 坚 持 认 为 ， 既 然 神 迹 的 存在 仅仅 是 基于 经 验 的 ， 那 么 
保卫 神 迹 也 同样 需要 基于 经 验 。 假 定 支 持 自 然 法 则 的 是 相同 的 事件 ( 例 
如 涨潮 或 者 每 天 的 日 出 )， 无 一 例外 地 接连 发 生 了 1 000 000 次 。 将 其 
视 为 一 个 观测 次 数 n = 1000 000 的 二 项 试验 ， 并 且 发 现 神奇 的 例外 个 
数 是 X= 0。 这 隐 含 了 “= 下 一 次 神 迹 的 概率 是 零 ” 吗 ? 不 是 的 。 普 
莱 斯 使 用 贝 叶 斯 定理 对 此 做 了 计算 ， 在 这 种 情况 下 ， 神 迹 发 生 概 率 大 
于 1/1 600 000 的 条 件 概 率 是 Prob (p > 1/1 600 000JX 2 01 20.5353, 好 
于 50% 的 概率 。 不 可 否认 ，1/1 600 000 确实 太 小 了 ， 但 还 没有 到 不 可 
能 的 地 步 。 反 之 ,将 其 作为 单 次 试验 中 神 迹 发 生 的 概率 时 ， 普 莱 斯 发 
现 ， 接 下 来 的 1 000 000 次 试验 中 至 少 发 生 一 次 神 迹 的 概率 为 

1.0 — (1 599 999/1 600 000)! 999999 = 0.465 

概率 接近 一 半 ! nx IER RTREP EXER KT PRETI UETR e 

贝 叶 斯 的 文章 出 版 后 基本 上 受到 了 半 个 世纪 之 久 的 忽略 ， 毫 无 疑 
问 , 这 要 归 答 于 印刷 刊物 上 出 现 的 乏味 标题 《求解 机 遇 理 论 的 一 个 问 
题 》)。 直到 20 世纪 , 后 验 概率 才 在 校准 推断 中 开始 发 挥 重 要 作用 , 这 
个 大 胆 的 标题 才 走 向 现实 ,但 当时 还 不 可 能 。 我 们 会 在 第 5 章 再 次 讨 


论 这 个 主题 。 








































































































































































































3.3 拉 普 拉 斯 检验 





整个 19 世纪 不 断 出 现 大 量 可 称 为 “显著 性 概率 ”的 特别 计算 。 这 
些 计算 通常 遵循 了 丹尼尔 伯 努 利 的 计算 思想 ， 使 用 数据 定义 一 组 值 
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的 极限 ， 再 在 某 些 随机 性 的 假设 之 下 找到 这 组 值 的 概率 。 

1827 年 ， 皮 埃 尔 ' 西蒙 : 拉 普 拉 斯 在 巴黎 天 文 台 看 到 了 一 个 长 序 
列 的 气压 表 读 数 ， 是 为 大 气 中 的 太阴 潮 提 供 证 据 而 记录 的 。 他 发 现 了 
一 个 x = 0.031758 的 效应 。 接 着 ， 因 为 缺少 任何 实际 效应 ， 拉 普 拉 斯 
计算 了 发 生 一 个 效应 ( 按 绝对 值 ) 不 大 于 0.3617 的 概率 。 这 会 对 应 到 
一 个 现代 的 1 一 0.3617=0.6383 的 双边 了 值 ， 他 还 给 出 判断 ，0.3617 太 
小 ( 即 P 值 太 大 ), 不 足以 支持 潮汐 的 存在 。 拉 普 拉 斯 写 道 : 





















































如 果 这 个 概率 (0.3617 ) 非常 接近 1， 它 会 以 极 大 的 似 然 
表明 x 的 值 并 不 单单 受到 概率 的 不 规则 性 影响 ， 也 会 受到 一 
种 恒定 原因 的 部 分 影响 ,这 种 原因 只 能 是 月 亮 对 大 气 的 作用 。 
但 这 个 概率 和 表示 为 1 的 确定 性 之 间 的 差异 相当 大 ， 这 就 意 
味 着 ， 尽 管 运用 的 观测 个 数 非 常 大 ， 这 种 作用 依然 仅仅 表明 
了 很 弱 的 似 然 。 因 此 ， 可 以 把 它 在 巴黎 的 这 种 可 察觉 的 存在 
性 看 作 不 确定 的 。 








拉 普 拉 斯 的 解释 经 受 住 了 时 间 的 考验 ,太阴 潮 在 巴黎 的 影响 太 弱 ， 
无 法 用 可 获得 的 观测 进行 检测 。 相 比 之 下 ， 他 能 找到 气压 计 变化 上 的 
季节 影响 的 证 据 (上午 9 点 到 下 午 3 点 的 气压 平均 改变 ), 这 里 , 拉 普 
拉 斯 给 出 了 现代 的 己 值 ， 同 时 阐述 称 : 没有 任何 季节 影响 的 情况 下 ， 
可 以 计算 出 ， 这 种 规模 的 或 者 规模 更 大 一 些 的 偏差 发 生 的 概率 是 
0.0000015815。 这 太 小 了 ， 不 能 归结 为 机 遇 。 

1840 年 ， 朱 尔 斯 ， 加 瓦 雷 特 用 “合法 ”出 生 的 性 别 比 与 “非法 ” 
出 生性 别 比 进行 了 比较 , 男性 的 比例 分 别 是 0.51697 和 0.50980， 相 差 
0.00717。 出 生 的 数目 很 大 (合法 1817572 人 ,非法 140 566 人 ， 如 图 
3-3 所 示 ), 并 且 他 遵循 了 一 条 借鉴 泊 松 思想 的 指导 原则 一 一 用 0.00391 
和 这 个 差 做 比较 ， 发 现 了 我 们 今天 描述 的 2V2 (= 2.828 ) 乘 以 差异 的 
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估计 的 标准 差 ， 相 0.0046 偶然 发 生 的 绝对 偏差 。 因 为 
见 测 到 的 差异 接近 这 个 阔 值 的 2 倍 ， 加 瓦 雷 特 对 此 解释 ， 这 表明 离 差 








ead 


y 
uc A 我 们 当然 想 提醒 他 ， 这 个 检验 不 能 告 
诉 我 们 ， 差 异 是 缘 于 社会 因素 还 是 生物 因素 。 


























1824-1835. 
Enfants légitimes. Enfants dd: 
m= g396ir 一 le nombre de garçons, |z’ = 71661 = le nombre des garcons, 
n — 877931 = le nombre des filles. n^ — 68905 — le nombre des filles. 


p= 1817572 =le nombre des naissances. | p’ = 140566 — le nombre des naissances. 


D'où résulte que la chance moycnne| D'où résulte que la chance: Moyenne 
de naissance d'un garcon en Francejde naissance d'un garcon en France 
dans l'état de mariage, est représentée|hors état de mariage, est représentée 
par le rapport spar le- rapport ps B 


m 939641. T Tk d 71661 
Eric rab. 16 = E 一 
En poussant l'approximation jusqu'à En poussant Yapproximation jusqu'à 
la cinquiéme décimale. la cinquième décimale. 











图 3-3 加 瓦 雷 特 的 出 生 数 据 (Gavarret 1840, 274) 




















美国 天 文学 家 西蒙 : 纽 康 从 新 的 视角 重新 思考 了 一 个 老 

。 比 如 易 星 团 的 情况 ,“ 第 五 星 等 的 6 颗 亮 星 在 天 球 的 单个 小 正方 
25025 异常 现象 吗 ? 或 者 说 ， 即 使 这 些 星 
星 在 苍穹 中 随机 散布 ， 我 们 可 以 认为 这 会 以 合理 的 概率 发 生 吗 ? 可见 
星 的 亮度 按 等 级 确定 ， 其 中 最 暗淡 的 星星 分 类 为 第 六 星 等 ， 亮 度 超过 
一 个 范围 的 星星 来 自 第 五 星 等 ， 以 此 类 推 。 一 个 好 的 近似 估算 是 ， 第 
五 或 更 高 的 星 等 有 N= 1500 颗 已 知 的 星星 ， 而 天 球 共 包 括 41 253 平方 
度 , 于 是 p= 单 颗 随 机 的 星星 会 落 在 天 球 任意 
纽 康 分 析 的 原创 之 处 在 于 ， 将 星星 的 分 布 当 作 一 个 泊 松 过 程 ， 
4=Np= 1500/41 253 = 0.0363 作为 空间 过 程 的 比率 ， heiss 
的 期 望 数目 。 那 么 ， 在 一 个 平方 度 中 发 现 s 颗 星星 的 概率 是 
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对 于 s=6， 这 给 出 的 概率 是 0.000000000003。 因 为 这 涉及 的 只 是 
单个 指定 的 平方 度 ， 而 选择 关注 易 星 团 是 因为 它 的 平方 度 最 紧密 。 纽 
康 知道 这 不 是 个 合适 的 概率 ， 所 以 相反 地 ， 他 找到 了 41 253 个 平方 度 
上 会 成 为 六 等 星 的 所 在 地 的 期 望 个 数 。 也 就 是 说 ， 用 41 253 乘 以 这 个 
小 概率 0.00000013 ， 结 果 依 然 是 一 个 微乎其微 的 小 数字 。 事 实 上 ， 他 
也 知道 这 并 非 一 个 正确 的 数字 ， 而 需要 的 是 这 样 的 概率 ， 为 了 能 够 包 
括 最 多 的 星星 而 允许 平方 度 小 幅 调整 。 但 纽 康 认为 ， 他 没 能 计算 出 的 
那个 答案 不 会 非常 大 。 他 确实 注意 到 ， 为 了 使 包含 六 等 星 的 区 域 的 预 
期 数 为 1， 需要 把 目标 空间 从 1 平方 度 扩展 到 27.5 平方 度 。 

































































3.4 似 然 理论 


在 我 已 经 给 出 的 例子 里 可 以 看 到 一 种 日 益 明 显 的 诡辩 ， 但 这 段 时 
期 也 开始 了 一 种 更 正式 的 理论 发 展 。18 世纪 中 期 ， 一 些 人 开始 用 数学 
问题 表示 观测 的 组 合 和 误差 的 分 析 。 他 们 中 的 某 些 人 ， 包 括 托马斯 ， 
PERR (1757, WEI 3-4 所 示 )、 约 其 ' 海 因 里 希 ' BEI (1760， 如 图 
3-5 所 示 )、 约 瑟 夫 路易斯. 拉 格 朗 日 (1769 )、 和 丹尼尔 伯 努 利 
(1769，1776， 如 图 3-6 所 示 )、 皮 埃 尔 < 西蒙 . 拉 普 拉 斯 ( 1774 及 以 后 ， 
如 图 3-7 所 示 ) 以 及 卡尔 . 弗 里 德里 希 : 高 斯 (1809) 等 ， 都 描述 了 
一 个 对 称 的 单 峰 误 差 曲 线 或 者 密度 。 作 为 其 分 析 的 一 部 分 ， 他 们 寻求 
选择 一 个 “最 有 可 能 ”概括 符合 心中 曲线 的 数据 。 
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图 3-4 辛普森 1757 年 的 曲线 ( 垂 线 左 侧 的 对 称 三 角形 )，AB 右 侧 
的 曲线 意图 表示 6 个 观测 的 平均 值 的 密度 ,但 这 是 根据 他 的 
想象 画 出 的 ， 并 不 精确 (Simpson 1757 ) 
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KI 3-5 朗 伯 1760 年 的 曲线 (Lambert 1760 ) 
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图 3-6 HZA] 1769 年 绘制 的 曲线 ， 其 中 figure 1 使 用 的 权重 基于 
figure 2 的 曲线 (Bernoulli 1769 ) 
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这 些 早期 分 析 中 的 一 部 分 可 以 视 为 我 们 今天 所 谓 的 “ 极 大 似 然 佑 
计 ” 的 先驱 。 这 些 理论 变 得 越 来 越 精细 : 拉 普 拉 斯 提出 ， 后 验 中 位 数 
以 尽量 缩小 后 验 期 望 误差 。 高 斯 在 这 个 问题 的 第 一 个 工作 中 采用 了 由 
叶 期 方法 , 给 出 一 个 平坦 的 先 验 ; 而 当 误差 是 正 态 分 布 时, 给 出 了 “最 
有 可 能 的 ”答案 ， 这 引出 了 最 小 二 乘法 〈 没 有 概率 内 容 的 最 小 二 乘法 
已 在 4 年 前 由 勒 让 德 发 表 ) 但 20 世纪 以 前 尚未 出 现 似 然 的 完整 理论 。 

20 世纪 20 年 代 ， 在 卡尔 : 皮尔 撑 的 一 些 早期 工作 的 基础 上 ( 包 
括 1900 年 皮尔 逊 对 卡 方 检验 的 有 影响 力 的 介绍 )， 费 合 尔 宣布 了 一 种 
相当 大 胆 又 可 以 理解 的 理论 : 如 果 0 代表 科学 的 目标 ,世代 表 数 据 ， 
两 者 都 可 以 是 多 维 的 ， 那么 似 然 函 数 可 以 定义 为 8 函数 的 观测 数据 忒 
的 概率 或 者 概率 密度 。 我 们 根据 习惯 ,将 这 个 记 法 中 的 印记 为 固定 的 
观测 ， 写 作 LO = LO | 区 。 他 会 取 能 使 L(0) 最 大 化 的 9， 在 某 种 意义 
E, 这 个 值 是 在 所 有 看 起 来 可 能 的 0 中 , 使 观测 数据 并 最 有 可 能 发 生 的 
值 。 并 且 ， 费 舍 尔 描述 了 这 种 选择 方法 ， 称 它 为 “0 的 极 大 似 然 估计 ”。 
到 此 ， 除 了 术语 以 外 ,他 和 丹尼尔 : 伯 努 利 、 朗 伯 以 及 高 斯 都 是 一 致 的 。 
但 费 舍 尔 还 声称 ， 当 最 大 值 作 为 一 个 光滑 函数 的 最 大 值 ， 并 通过 对 0 
求 导 且 设 置 求 导 结果 为 0 而 求解 时 ， 可 以 发 现 精度 (估计 的 标准 差 ) 是 
来 自 工 最 大 值 点 的 曲率 (二 阶 导 ) 的 优良 近似 。 我 们 还 可 以 发 现 ， 这 个 
估计 表达 了 数据 提供 的 所 有 相关 信息 , 也 不 可 能 再 通过 其 他 的 一 致 估计 
方法 改进 性 能 。 如 此 ， 它 就 是 所 有 统计 学 家 期 盼 的 答案 : 理论 上 最 优 ， 
程序 简单 ， 而 且 不 费 什 么 代价 就 可 以 得 到 精度 的 完整 描述 。 
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图 3-7 拉 普 拉 斯 1774 年 的 曲线 ， 现 在 称 为 “ 双 指 数 密 度 ” 
(Laplace 1774 ) 
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费 舍 尔 程序 的 最 初 思想 在 应 用 中 没有 这 么 一 般 化 ， 也 没有 这 么 严 
密 和 完整 。 严 格 证 明太 困难 ， 因 此 借助 了 一 些 反 例 。 反 例 中 的 大 多 数 
是 病态 的 一 一 例子 真实 ， 但 对 实践 没有 困扰 。 一 个 显然 的 例外 是 毛里 
斯 :巴特 莱特 在 1937 年 和 亚伯拉罕 ' 瓦尔 德 在 1938 年 分 别 发 现 的 
(同年 ， 他 还 与 杰 日 . 奈 曼 就 此 进行 了 通信 )， 奈 曼 和 伊丽莎白 斯 科 
特 在 10 年 后 发 表 了 这 个 反例 的 简单 版 本 , 基本 内 容 如 下 。 假设 你 的 数 
据 包 含 个 独立 的 正 态 分布 的 数据 对 (CY;, 7;)， 其 中 每 一 对 了 和 了 是 独 
立 的 测量 ,期 望 久 相同 , 但 所 有 六 和 了 都 有 相同 的 方差 o*。 于 是 ， 有 
n+1 个 需要 估计 的 量 。 jw 的 最 大 似 然 估计 是 数据 对 的 均值 , (X+ Y; )/2, 
而 且 方 差 “的 最 大 似 然 估计 是 X; — Y; )/4n， 一 个 期 望 为 a 7/2 的 估 
计量 仅仅 是 它 应 该 成 为 的 数值 的 一 半 。 困 难 出 现 了 ， 因 为 这 是 对 每 两 
个 样本 的 个 个 别 的 方差 估计 的 平均 。 正 态 情 况 下 ,样本 大 小 为 m 的 
方差 的 极 大 似 然 估计 是 有 偏差 的 ， 等 于 方差 乘 以 mm- 1)/m。 如 果 m 很 
大 ， 这 个 结果 会 接近 1; 但 对 于 m = 2， 则 是 12。 现 在 把 它 作为 一 个 
大 数据 问题 考虑 ， 其 中 记录 的 数据 个 数 大 约 等 于 目标 的 数量 。 全 部 样 
本 中 的 信息 必须 分 散在 大 量 的 目标 上 ， 而 且 不 能 把 任务 的 各 部 分 都 做 
好 。 这 个 例子 可 以 视 为 最 大 似 然 估 计 在 大 数据 应 用 上 的 困难 或 挑战 : 
它 确实 能 预期 均值 ， 而 旦 容易 补偿 方差 的 问题 ( 只 要 乘 以 2 )， 但 这 也 
确实 表示 处 理 高 维 问题 时 要 小 心 。 

尽管 有 这 些 周 折 ， 但 费 舍 尔 程序 不 仅 为 这 个 世纪 的 其 余 大 部 分 时 
间 设 定 了 研究 议程 ， 而 且 他 支持 的 似 然 方法 或 与 其 非常 相关 的 其 他 方 
法 ， 在 许多 可 行 的 领域 也 占据 了 主导 的 实践 地 位 。 

虽然 费 舍 尔 做 了 许多 显著 性 检验 的 应 用 ， 但 他 表达 成 原 假设 的 检 
验 ， 并 没有 明确 的 备 选 假 设 。 这 就 轮 到 了 奈 曼 和 伊 风 : 皮尔 了 还 ， 他 们 
基于 似 然 的 直接 比较 以 及 备 选 假 设 的 明确 介绍 ， 发 展 出 假设 检验 的 一 
种 形式 化 理论 。 检 验 的 思想 一 一 无 论 在 费 舍 尔 的 意义 上 还 是 在 奈 曼 和 
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皮尔 逊 的 意义 上 一 一 显然 已 经 有 了 巨大 影响 。 它 的 应 用 相当 普遍 ， 

在 某 些 方面 或 某 些 运 用 方式 上 受到 了 批评 、 引 起 了 关注 ， 比 如 不 I 
判 地 接受 和 常规 使 用 的 5% 的 水 平 。 这 些 都 证 明了 它 的 巨大 影响 。 与 
似 然 相 联系 的 思想 作为 一 种 方法 校准 推断 一 一 在 统计 背景 中 放 人 数据 
变 差 和 我 们 会 放置 在 观测 差异 上 的 置信 和 度 一 一 已 经 成 为 现代 统计 的 
x. 














第 4 章 


相互 比较 : 作为 标准 的 样本 内 变异 





第 四 根 支 柱 一 一 相互 比较 一 一 指 这 样 一 种 思想 : 统计 比较 可 以 严 
格 遵循 数据 的 内 部 变异 进行 ， 而 无 须 参 考 甚 至 依赖 外 部 准则 。 这 种 思 
想 的 大 意 很 古老 ， 但 我 能 想到 的 精确 表述 直到 1875 EFRR, HI 
朗 西 斯 . 高 尔 顿 提 出 。 使 这 种 思想 发 扬 光 大 并 成 为 统计 学 主流 的 扩 
展 工 作 ， 则 发 生 在 高 尔 顿 的 文章 发 表 之 后 的 10 年 、33 年 和 50 年 , 分 
别 由 厚度 西 斯 . 埃 奇 沃 思 、 威 廉 希 利 : 戈 塞 特 和 罗 纳 德 ，A. REIR 
完成 。 

1875 年 发 表 的 文章 《相互 比较 的 统计 》 中 ， 高 尔 顿 给 出 了 一 种 有 
几 个 理想 属性 的 比较 方法 ,其 中 包括 , 在 比较 时 ,“ 我 们 可 以 省 去 参考 
标准 ,而 可 以 通过 共同 接受 的 说 法 创建 并 间接 定义 它们 。…… CEN) 
完全 受到 相互 比较 影响 , 不 需要 借助 任何 外 部 标准 ”。 这 个 定义 适用 于 
后 来 发 展 出 的 概念 ， 但 高 尔 顿 自己 的 应 用 局 限于 百 分 位 数 的 使 用 ， 特 
上 是 〈 但 不 完全 是 ) 中 位 数 和 两 个 四 分 位 数 。 这 些 方法 只 要 通过 排序 
据 就 可 以 完成 ， 不 需要 比 计数 更 复杂 的 算术 计算 。 而 且 ， 即 使 在 某 
青 况 下 ， 测 量 是 描述 性 的 、 排 序 的 而 非 数 值 时 ， 百 分 位 数 的 表现 也 
展 好。 其 实 早 在 1896 年 , 高 尔 顿 就 第 一 次 使 用 了 百 分 位 数 。 在 其 著作 
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Hereditary Genius 中 ， 高 尔 顿 使 用 了 几 组 生物 学 中 的 专门 术语 排列 并 
比较 群体 中 的 天 才 ， 而 没有 用 到 任何 有 关 天 才 的 数值 测量 。 这 本 书 至 
今 一 点 名 气 也 没有 ， 但 它 的 统计 方法 完全 正确 。 





41 戈 塞 特 和 费 舍 尔 的 HA 


带 着 历史 的 “后 见 之 明 ”, 我 们 可 以 说 , 相互 比较 的 数学 深入 应 用 
的 第 一 粒 种 子 , 在 1908 年 由 一 位 看 似 不 可 能 的 父亲 播 下 。1899 年 起 ， 
戈 塞 特 受 到 都 柏林 的 吉 尼 斯 公司 雇用 ， 成 为 一 名 化 学 技师 。 他 曾 在 牛 
津 的 新 学 院 接受 数学 训练 (1897 年 获得 数学 学 科 第 一 等 学 位 ) 和 化 学 
训练 (1899 年 获得 第 一 等 学 位 )， 而 且 很 快 看 出 了 统计 对 啤酒 三 的 巨 
大 作用 。1904~1905 4E, 他 阅读 了 伦敦 大 学 学 院 的 卡尔 皮尔 逊 实验 室 
的 最 新 工作 报告 ， 总 结 了 误差 理论 和 相关 系数 的 使 用 ， 写 下 了 一 组 内 
部 备忘录 (实际 上 是 内 部 指导 文本 ), 这些 备忘录 的 第 一 份 中 , KER 
有 一 个 陈述 ， 表 达 了 希望 将 P 值 与 数据 相 联系 的 想法 :“ 我 们 遇 到 一 
些 困 难 ， 没 有 哪 本 书 曾 提 过 这 种 可 能 性 (the odds )。 它 易于 接受 以 建 
立 任何 结论 ， 这 件 事 去 咨询 某 位 数学 物理 学 家 对 我 们 来 说 或 许 有 益 。” 
这 位 物理 学 家 当然 就 是 皮尔 逊 。 

1906~1907 4E, 吉 尼 斯 公司 同意 戈 塞 特 离职 , 去 皮尔 逊 的 实验 室 
访问 两 个 学 期 ， 以 学 习 更 多 知识 。 在 那里 ， 戈 塞 特 写 出 了 文章 《均值 
的 可 能 误差 六 通过 这 篇 文章 ， 他 树立 了 其 统计 学 家 的 声望 (如 图 4-1 
所 示 )。 




































































图 4-1 
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BIOMETRIKA. 


THE PROBABLE ERROR OF A MEAN. 
Bv STUDENT. 


Introduction. 


ANY experiment may be regarded as forming an individual of a “ population " 
of experiments which might be performed under the same conditions. A series 
of experiments is a sample drawn from this population. 


Now any series of experiments is only of value in so far as it enables us to form 
a judgment as to the statistical constants of the population to which the experi- 
ments belong. In a great number of cases the question finally turns on the value 
of a mean, either directly, or as the mean difference between the two quantities. 


If the number of experiments be very large, we may have precise information 
as to the value of the mean, but if our sample be small, we have two sources of 
uncertainty :一 (1) owing to the “error of random sampling " the mean of our series 
of experiments deviates more or less widely from the mean of the population, and 
(2) the sample is not sufficiently large to determine what is the law of distribution 
of individuals. It is usual, however, to assume a normal distribution, because, in 
a very large number of cases, this gives an approximation so close that a small 
sample will give no real information as to the manner in which the population 
deviates from normality: since some law of distribution must be assumed it is 
better to work with a curve whose area and ordinates are tabled, and whose 
properties are well known. This assumption is accordingly made in the present 
paper, so that its conclusions are not strictly applicable to populations known not 
to be normally distributed; yet it appears probable that the deviation from 
normality must be very extreme to lead to serious error. We are concerned here 
solely with the first of these two sources of uncertainty. 

The usual method of determining the probability that the mean of the popula- 
tion lies within a given distance of the mean of the sample, is to assume a normal 
distribution about the mean of the sample with a standard deviation equal to 
s/n, where s is the standard deviation of the sample, and to use the tables of 
the probability integral. 

Biometrika vr $ 








( Gosset 1908 ) 





1908 年 论文 的 第 一 页 ， 引 入 了 会 以 上 检验 而 闻名 的 “学 生 ” 


1908 年 ,这 篇 文章 以 "学 生 ” 的 笔名 发 表 在 皮尔 逊 的 刊物 Biometrika 
上 。 这 反映 了 当时 吉 尼 斯 公司 坚持 的 一 项 政策 : 员工 的 外 部 出 版 物 不 














得 标识 他 们 的 公司 来 源 。 此 文 没 有 突 
中 的 潜在 应 用 ， 而 且 ， 那 时 大 家 把 它 
产品 。 除 了 其 中 一 点 之 外 ， 本 文 在 其 
世纪 以 来 ， 科 学 家 们 在 天 文学 中 例 和 
根据 “可 能 的 误差 ”或 简写 p.e HR 




















出 这 个 方法 在 啤酒 酿造 质量 控制 
视 为 皮尔 逊 团队 的 一 ap 
二 他 方面 的 表现 也 确实 平平 。 

了 公事 一 样 地 使 用 算术 平均 值 ， 
其 准确 性 。 对 于 正 态 分 布 的 数据 ， 
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p.e. 被 定义 为 中 位 数 误差 。1893 年 ， 皮 尔 逊 引入 了 替代 性 的 标尺 “ 标 
准 差 ， 记 为 SD 或 c， 它 与 p.e. 成 比例 (p.e. = 0.67450) mH., K2 
逊 的 方法 很 快 成 为 常规 方法 。 对 于 大 样本 ， 如 果 无 法 计算 它 的 值 ， 统 

















计 学 家 会 毫 不 犹 殉 地 采用 ， -Xa -Xy 代替 o Colt RH B 


好 , 采用 axe - Xy X 戈 塞 特 的 那 篇 文章 的 目标 是 试图 理解 ， 


样本 不 是 很 大 且 这 些 估计 的 准确 性 有 限时 ， 这 种 近似 的 不 足 需要 什么 
样 的 补偿 。 他 特别 了 解 , 各 个 总 服从 均值 为 0 的 正 态 分 布 时 , X /o 服 


从 均值 为 o BAREEN vn ES FU. c IY oc - Xy 
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铭 尔 把 这 个 标尺 更 改 为 现在 我 们 都 很 熟悉 的 单 样本 t 统计 量 ， 它 们 之 
间 的 联系 是 += Vn- 

借助 没有 严格 证 明 支 持 的 出 色 猜 测 以 及 这 些 猜测 产生 的 合理 分 
析 ， 戈 塞 特 导出 了 正确 的 结 我 们 现在 〈 根据 费 舍 尔 的 标尺 ) 称 
为 “自由 度 为 -II 的 学 生 1 分 布 ”。 这 个 过 程 包 含 了 数学 上 的 一 些 运气 ， 
苞 塞 特 隐 含 地 假设 ， 样 本 均值 和 样本 标准 差 之 间 缺 乏 相关 性 ， 意 味 着 
它们 相互 独立 。 这 在 他 的 正 态 情况 下 是 真 的 ， 但 在 其 他 任何 情况 下 都 
不 是 。 图 4-2 显示 了 9 个 自由 度 的 z 的 分 布 ( 实 线 ), 与 标准 差 相同 (在 
这 个 尺度 上 是 1/ V7 = 0.378 ) 的 正 态 分 布 进行 比较 。 他 注意 到 ， 双 方 
的 一 致 性 还 不 错 ， 但 标准 差 更 大 时 ， 正 态 分 布 会 给 出 一 种 “虚假 的 安 





REN, SÆTA? z= 的 分 布 是 什么 ? 后来， 费 
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DiaGRAM II. Solid curve y= x BeA 2 oo 0, tJs= tan 0. 
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Broken line curve y= yr N e **', the normal curve with the same s.p. 
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Distance of mean from mean of population 


图 4-2 1908 年 论文 示意 图 ， 比 较 正 态 分 布 和 1 分 布 (自由 度 为 9 ) 
的 密度 (Gosset 1908 ) 











n 越 大 , 曲线 就 越 接 近 正 态 分 布 。 戈 塞 特 附 上 了 一 个 表格 , 对 n=4、 
. 10 计算 显著 性 概率 ， 并 且 使 用 了 一 些 例 子 说 明 这 个 表格 的 使 
这 些 例子 中 最 著名 的 是 Cushny-Peebles 数据 ”( 如 图 4-3 所 示 )。 











利用 图 4-3 表格 中 最 后 一 列 的 成 对 差异 , 戈 塞 特 发 现 z=1.58/1.17=1.35。 
就 是 说 , 均值 差 与 0 相距 1.35 倍 的 标准 差 。 这 会 给 出 t= 1.35 J(n-1) = 
1.35 x 3 = 4.05。 由 此 ， 他 说 :“ 这 张 表格 可 以 得 出 ， 概 率 是 0.9985, 

或 概率 大 约 为 666 对 1， 所 以 第 二 种 是 更 好 的 催 眼 药剂。 “学生 ” 的 
-分布 由 此 诞生 ， 并 初试 牛刀 。 我 们 可 以 在 结论 中 发 现 没 有 根据 的 贝 
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斯 推论 的 缺陷 ， 在 来 源 中 发 现 错误 引用 (这 篇 文章 发 表 在 1905 年 ， 











而 非 1904 年 )， 在 药物 中 发 现 错误 识别 〈 他 错误 标记 了 列 ， 而 且 事 实 


IE 


他 复制 的 数据 并 非 用 于 催眠 ), 以 及 不 恰当 的 分 析 (个 体 的 数据 事 











CD 这 个 数据 集 显 示 了 两 种 催眠 药物 对 10 位 患者 的 治疗 效果 。 一 一 译 者 注 
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实 上 意味 着 大 小 不 同 的 样本 ， 因 此 方差 非常 不 同 ， 并 且 通 过 使 用 一 个 
共同 的 缩放 比例 使 它们 看 起 来 相关 )。 但 至 少数 值 工作 是 清晰 且 正 确 
的 ,并 且 其 他 内 容 正 确 遵 循 了 逻辑 。 
































Section IX. Illustrations of Method. 


Illustration I. As an instance of the kind of use which may be made of the 
tables, I take the following figures from a table by A. R. Cushny and A. R. Peebles 
in the Journal of Physiology for 1904, showing the different effects of the optical 
isomers of hyoscyamine hydrobromide in producing sleep. The sleep of 10 patients 
was measured without hypnotic and after treatment (1) with D. hyoscyamine 
hydrobromide, (2) with L. hyoscyamine hydrobromide. The average number of 
hours' sleep gained by the use of the drug is tabulated below. 


The conclusion arrived at was that in the usual dose 2 was, but 1 was not, of 
value as a soporific. 


Additional hours’ sleep gained by the use of hyoscyamine hydrobromide. 


Patient 1 (Dextro-) 2 (Laevo-) Difference (2-1) 
1l. 十 了 十 19 +12 
2. 一 16 +'8 +24 
3. 一 22 +11 +13 
4. -12 td +13 
5. -1 一 1 0 
6. +34 +44 +10 
T. +37 +55 +18 
8. + 8 +16 + 8 
9. 0 十 46 十 46 

10. +20 +34 +14 


Mean + 75 Mean +233 Mean +158 
S.D. 170 $&D. 190 S&D 117 











图 4-3 1908 年 论文 的 Cushny-Peebles 数据 。 第 一 列 中 的 -1 是 -0.1 
的 印刷 错误 ( Gosset 1908 ) 





对 于 当前 的 目的 ， 要 点 是 比较 带 有 样本 标准 差 的 样本 均值 一 一 在 
没有 利用 任何 外 部 参考 的 情况 下 做 出 的 一 一 既 没 有 参考 “真实 的 ” 标 
准 差 ， 也 没有 参考 科学 研究 领域 通常 接受 的 阔 值 。 更 直接 地 说 ， 比 值 
t 的 分 布 绝 不 包含 c ， 因 此 任何 包括 比值 t 的 概率 统计 量 一 一 比如 P 
值 一 一 都 可 以 在 数据 内 部 做 出 。 如 果 这 个 比值 的 分 布 随 a 变化, t 证 据 
的 使 用 也 会 随 着 o 变化 。 学 生 t 推断 是 一 种 纯粹 的 内 部 数据 分 析 。 这 
种 相互 比较 的 使 用 将 自身 从 输入 中 解放 出 来 ， 威 力 强大 。 它 也 将 自己 
置 于 批评 面前 ， 这 些 批评 在 1919 年 已 经 很 常见 ， 直 到 今天 也 未 减弱 : 










































































Ina 


第 4 章 相互 比较 : 作为 标准 的 样本 内 变异 | 57 




















统计 显著 性 不 需要 反映 科学 的 显著 性 吗 ? 这 个 差异 断言 了 有 关 催 眠 方 
法 的 任何 的 实际 显著 性 吗 ? 戈 塞 特 对 此 未 置 一 词 。 但 是 ， 当 误导 性 的 
陈述 依然 是 一 个 问题 时 ， 关 注 手边 数据 的 能 力 成 为 一 种 威力 ， 一 种 不 
可 否认 的 好 处 。 

蕊 塞 特 的 文章 发 表 后 就 几乎 被 忽略 了 。 发 表 的 刊物 十 分 出 名 ， 一 
些 调查 也 对 这 篇 文章 做 了 例 行 引 用 ， 但 直到 20 世纪 20 年 代 ， 似 乎 没 
人 真正 在 出 版 物 中 使 用 这 个 检验 。1914 年 出 版 的 《统计 学 家 和 生物 统 
计 学 家 用 表 》 中 ,皮尔 逊 介绍 了 戈 塞 特 的 检验 和 表格 ， 并 给 出 了 1908 
年 论文 中 的 例子 ， 包 括 不 正确 的 Cushny-Peebles 数据 和 贝 叶 斯 推断 。 
但 根据 我 的 检索 ，1925 年 以 前 没有 一 个 成 功 使 用 上 检验 的 例子 。 我 在 
都 柏林 的 吉 尼 斯 档案 馆 待 了 一 个 下 午 ， 检 索 1908~1924 年 的 科学 备 忘 
录 ， 没 有 任何 发 现 : 戈 塞 特 自己 在 实践 工作 中 忽视 了 这 个 检验 。 我 找 
到 好 几 个 使 用 了 统计 的 例子 ， 都 是 根据 均值 距 0 有 和 多少 个 标准 差 描述 
差异 的 。 但 实践 中 都 没有 上 检验 ， 也 没有 对 这 篇 论文 的 引用 。 

即便 如 此 ， 这 篇 论文 还 是 产生 了 深远 的 影响 ， 这 都 要 归功 于 一 位 
特殊 的 读者 看 出 了 它 结果 中 的 魔力 。 费 舍 尔 很 可 能 在 1912 年 从 剑桥 毕 
业 时 就 已 经 阅读 了 这 篇 论文 ， 他 看 到 文章 里 没有 证 明 ， 但 看 出 从 多 维 
几何 的 角度 思考 这 个 问题 会 得 到 简单 和 严格 的 证 明 。 他 写 信 给 戈 塞 特 
(不 知 怎么 他 已 经 了 解 到 “学 生 ” 的 真实 身份 )， 解释 了 这 个 证 明 , 但 
戈 塞 特 没 能 理解 。 当 戈 塞 特 把 它 转 寄 给 皮尔 逊 时 , 皮尔 逊 也 没 能 理解 。 
这 封 信 遗 失 了 , 而 且 可 能 从 未 被 回复 过 。1915 年 , REKTE Biometrika 
上 以 一 篇 短小 精 悍 的 文章 介绍 了 这 个 证 明 ， 他 在 文中 还 提 到 自己 发 现 
了 一 个 更 复杂 的 统计 量 一 一 相关 系数 + 的 分 布 。 

戈 塞 特 的 检验 依然 没有 受到 关注 。 到 20 世纪 20 年 代 早期 ， 那 时 
的 费 售 尔 正在 罗 萨 姆 斯 泰 德 试 验 站 研究 农业 问题 ， 他 已 经 看 出 ， 将 学 
^E t 分 布 从 对 o 的 依赖 中 解放 出 来 的 数学 魔法 只 是 冰山 一 角 。 费 舍 尔 
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创造 了 双 样 本 t+- 检验， 并 推导 出 了 用 于 回归 系数 的 分 布 理论 以 及 方差 
分 析 的 完整 步骤 。 

要 想 了 解 戈 塞 特工 作对 统计 实践 的 历史 影响 ， 需 要 追溯 到 费 舍 尔 
的 教科 书 对 其 的 介绍 。 这 本 开创 性 的 书 出 版 于 1925 年 , 名 为 Statistical 
Methods for Research Workers。 戈 塞 特 自己 的 论文 提出 了 一 种 杰出 的 思 
想 ， 但 程度 仅仅 到 单 样本 检验 为 止 。 这 种 检验 除了 应 用 于 样本 的 成 对 
差异 外 ， 很 少 有 其 他 用 处 。 费 舍 尔 吸收 了 这 种 思想 ， 并 把 它 扩 展 到 两 
个 甚至 多 个 样本 的 情况 。 这 种 情形 下 ， 该 方法 显现 出 了 真正 强大 的 作 
用 。 费 舍 尔 的 方差 分 析 是 真正 的 变异 分 析 ， 他 按照 一 种 前 人 从 未 尝试 
的 方法 分 解 变异 。 好 吧 , 这 些 并 不 是 都 是 真 的 , 埃 奇 沃 思 早 在 40 年 前 
就 已 经 做 出 了 某 些 卓越 的 工作 。 





















































4.2 ŻAK : 埃 奇 沃 思 和 方差 成 分 的 双 因 素 分 析 














19 世纪 80 年 代 ， 埃 奇 沃 思 致力 于 将 概率 尺度 的 应 用 扩展 至 社会 
科学 。 为 此 ， 他 发 展 了 一 种 统计 表格 的 分 析 方 法 ， 这 种 方法 早 于 费 铭 
尔 之 后 所 做 的 部 分 工作 。 在 英国 科学 促进 会 1885 年 9 月 于 阿 伯 丁 举办 
的 科学 进展 会 议 上 ， 埃 奇 沃 思 结 合 两 个 例子 给 出 了 他 的 方法 ， 一 个 是 

意 设计 的 ， 男 一 个 则 受到 社会 科学 的 广泛 承认 。 对 于 第 一 个 例子 ， 
他 用 表格 列 出 了 维 吉 尔 的 作品 《 埃 涅 阿 斯 纪 》 的 一 个 片段 中 的 扬 抑 抑 
格 ( dactyl, 一 个 长 音节 后 面 跟随 两 个 短 音节 的 音 步 ， 如 图 4-4 所 示 )。 
对 于 第 二 个 例子 , 他 采用 了 1883 年 户籍 总 署 署 长 报告 的 英国 6 个 郡 8 
年 间 的 死亡 率 ( 如 图 4-5 所 示 )。 这 两 个 例子 中 ,他 都 提供 了 每 行 、 每 
列 的 和 以 及 均值 ， 还 有 所 谓 的 “波动 ” fluctuation )， 两 倍 于 我 们 现在 
所 称 的 “经 验方 差 >"， 即 相应 的 行 和 列 满足 275(X, -XV /n. 
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图 4-4 埃 奇 沃 思 1885 年 对 维 吉尔 的 《 埃 涅 阿 斯 纪 》 所 做 的 数据 分 
析 。 这 里 和 图 4-5 中 的 一 些 数 值 误差 在 文献 Stigler(1999) 的 
第 $ 章 中 做 了 修正 (Edgeworth 1885 ) 


































































































































































































1876.| 1877. | 1878. | 1879. | 1880. | 1881. | 1882. | 1883. | Sums. | Means. | Fluctus 
Berks............| 175 | 172 | 187 | 186 169 | 166 |1389 |i1734| d 
Herte 28 174| 165 | 185 | 184 163 | 188 |1401 | 175 £ 
Bucks ....| 182 | 171| 186| 195 177 | 183 |L435 | 1793| X 
Oxford ....... 179 | 182 | 194 | 183 167 | 166 |1,420 | 1773| 3 
Bedford ..| 196| 174| 203| 195 181 | 184 [1,502 | 1883 $ 
Cambridge | 173| 177| 190| 191 171 | 181 1485 | 179} D 
Sums.. 1079 | 1,041 |1,145 |1184 | 1,101 [1,028 |1,068 |8,582 |1,078 | 1,138 
Means ....| 180 | 1734| 191 | 189 | 188} | 164 | 171 | 178 |1,030| 179 190 
+ 
Fluctuations. ki EJ t: o e 总 ine 3 T 

















图 4-5 RINRI 1885 年 关于 郡 死亡 率 的 数据 分 析 (Edgeworth 1885 ) 


埃 奇 沃 思 的 分 析 有 一 种 潜台词 。 这 两 种 情况 下 , 数据 都 是 计数 的 ， 
要 么 是 直接 的 计数 ( 维 吉 尔 ) 要 人 么 单位 化 到 每 万 人 的 计数 (死亡 率 )。 
当时 ， 威 尔 赫 姆 莱克 而 斯 发 展 了 一 种 方法 ,尝试 在 茶 种 二 项 变异 上 
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进行 分 析 。 埃 奇 沃 思 将 这 种 方法 称 为 “组 合 的 ”( combinatorial )， 并 
明确 地 想 要 避免 这 样 一 种 假设 。 他 的 分 析 仅 仅 是 建立 于 数据 的 内 部 
变异 , 用 高 尔 顿 的 术语 来 说 就 是 “相互 比较 ”。 莱克 希 斯 的 方法 将 二 项 
变异 作为 外 部 标准 。 使 用 简单 的 掷 硬币 模型 作为 基准 是 一 种 古老 的 诱 
惑 一 一 想 想 阿布 斯 诺 特 和 出 生性 别 数据 。 但 在 更 复杂 的 情况 中 ， 这 需 
要 付出 代价 。 对 一 个 及 次 试验 的 二 项 分 布 ， 并且 单 次 试验 成 功 概率 
为 p， 它 的 均值 np 和 方差 np (1 — p ) 严 格 相关 ， 而 且 不 是 所 有 数据 都 
能 反映 这 种 联系 。 事 实 上 ， 阿 布 斯 诺 特 的 出 生 数据 是 少 有 的 二 项 分 布 
起 作用 的 情况 ， 从 那 之 后 ， 大 部 份 数据 都 存在 分 析 家 们 所 谓 的 “过 度 
分 散 ”: 变异 大 于 简单 的 二 项 分 布 ,有 可 能 因为 p 在 试验 中 有 随机 变化 。 
埃 奇 沃 思想 要 避免 莱克 西 斯 受到 的 约束 。 用 今天 的 术语 来 说 ， 无 论 数 
据 是 不 是 二 项 分 布 的 , 只 要 变异 是 近似 正 态 的 , 埃 奇 沃 思 就 可 以 处 理 。 

埃 奇 沃 思 的 分 析 框 架 是 我 们 今天 所 称 的 “方差 分 量 ” 的 一 种 估计 。 
例如 ， 将 所 有 死亡 率 放 入 一 组 ， 我 们 可 以 考虑 把 全 部 的 “波动 ” 当 作 
3 个 分 量 之 和 : C?+ C + C;， 其 中 第 二 个 成 分 代表 时 间 ( 年 到 年 ) 
变异 ， 第 三 个 分 量 代表 地 点 CBE) 变异 ， 而 第 一 个 分 量 代 表 独 立 于 时 
间 和 地 点 的 随机 变异 。 如 果 分 析 师 想 比 较 同 一 个 郡 随时 间 变 化 的 死亡 
率 , 可 以 使 用 行 的 均值 或 者 汇集 的 波动 ( 图 4-5 中 的 190 ) 作 为 C + C? 
的 估计 以 评估 准确 性 ; 而 为 了 比较 同一 年 中 各 郡 的 情况 ， 可 以 相应 地 
使 用 C+ ?进行 估计 (图 4-5 中 的 88 )。 为 了 估计 随机 波动 C" ， 可 
以 考虑 平均 的 行 波动 减 去 均值 行 的 波动 的 差 ，190-146 = 44 ; 也 可 以 
考虑 平均 的 列 波动 减 去 均值 列 的 波动 的 差 ，88 一 46 = 42 。 因 为 这 是 数 
值 工作 而 非 代 数 工作 ， 他 没有 意识 到 ， 除 了 计算 中 的 误差 ,这些 差 应 
该 精确 相等 ， 都 等 于 2SSE /1J。 其 中 了 和 J 分 别 是 行 数 和 列 数 ，SSE 是 
拟 合 可 加 模型 的 残 差 平 方 和 。 类 似 地 ， 他 能 发 现 ， 维 吉尔 往往 对 不 同 
音 步 或 不 同 诗 段 采用 不 同 韵律 频率 。 
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埃 奇 沃 思 的 工作 可 以 说 是 一 系列 错失 的 机 会 ， 元 凶 是 数值 的 误差 
和 代数 的 笨拙 。 他 的 估计 是 方差 分 析 中 平方 和 的 简单 线性 函数 ， 而 且 
其 某 些 计算 现在 可 以 认为 与 费 舍 尔 后 来 用 在 类 似 分 析 中 的 某 些 已 统 计 
量 大 致 相同 。 但 埃 奇 沃 思 没 有 用 分 布 理论 补充 它们 。 当 费 舍 尔 在 20 
世纪 20 年 代 中 期 面 对 这 个 问题 时 ,他 显然 看 到 了 完整 的 代数 结构 和 正 
交 性 ， 比 如 多 元 正 态 分 布 的 数学 逻辑 、 人 允许 行 效 应 和 列 效 应 的 统计 分 
解 、 可 以 仅仅 基于 数据 内 部 变异 的 显著 性 独立 检验 进行 测量 。 

20 世纪 后 半 叶 ， 计 算 机 的 使 用 迅速 普及 , 由 此 产生 了 大 量 使 用 计 
算 机 的 过 程 的 更 多 应 用 ， 其 中 包括 几 个 可 以 认为 是 使 用 了 相互 比较 的 
过 程 。20 世纪 50 ER, BEW- 昆 努 利 以 及 之 后 的 约翰 ， 图 基 发 展 
了 一 种 估计 标准 差 的 估计 方法 : 通过 相继 删除 每 个 观测 以 考虑 估计 变 
化 了 多 少 。 图 基 将 这 个 过 程 命名 为 “ 刀 切 法 ”(jackknife )。 与 此 相关 ， 
一 些 人 提出 了 在 名 为 交叉 验证 的 方法 下 研究 变异 ， 即 在 交叉 验证 中 对 
数据 的 子 集 执 行 一 个 过 程 并 比较 结果 。20 世纪 70 年 代 晚 期 ， 布 拉 德 
利 ， 埃 弗 龙 引入 了 他 口中 的 “自助 法 ”(bootstrap )， 现 在 已 得 到 广泛 
应 用 。 该 方法 有 一 个 以 随机 替换 方式 重 抽样 的 数据 集 ， 和 一 个 每 次 都 
会 计算 的 目标 统计 量 ， 这 个 “自助 样本 ”的 变异 性 可 以 用 于 判断 那些 
没有 统计 模型 可 借助 的 统计 量 的 变异 性 。 所 有 这 些 方法 在 估计 变异 性 
时 都 涉及 了 相互 比较 。 








































































































4.3 ”相互 比较 的 一 些 陷阱 


如 果 仅 仅 依靠 一 种 数据 内 部 变异 的 分 析 作 为 指导 ， 将 会 遇 到 许多 
VADE. 模式 似乎 已 经 出 现 , 接 下 来 就 是 解释 模式 的 故事 。 数据 集 越 大 ， 
故事 越 多 。 有 些 故 事 是 有 用 的 ， 或 具有 深刻 意义 的 ， 但 许多 故事 两 者 
皆 非 ， 甚 至 有 些 最 优秀 的 统计 学 家 也 会 受到 这 些 差异 的 蒙蔽 。 
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威廉 : 斯 坦 利 . 杰 文 斯 并 不 是 第 一 个 在 经 济 时 间 序 列 中 分 辨 出 商 
业 周期 的 人 ， 也 不 是 第 一 个 在 商业 周期 和 太阳 黑子 行为 周期 之 间 看 到 
存在 可 能 联系 的 人 。 但 19 世纪 70 年 代 后 期 ， 他 痴迷 于 这 种 思想 ， 其 
至 面 对 公 众 和 专家 的 嘲讽 依然 如 此 。 他 的 阁 迷 超过 了 前 裴 ， 而 对 后 来 
者 则 意味 着 警告 。 

人 们 对 周期 的 深入 研究 引发 了 天 文学 历史 上 的 一 些 最 伟大 的 发 
现 , 但 社会 科学 中 的 周期 类 型 与 此 不 同 。 商 业 周期 事实 上 是 “周期 性 
的 ”, 但 通常 会 有 调整 , 一 位 赛马 比赛 的 分 析 师 将 其 称 为 “不 断 变 化 的 
周期 ”。19 世纪 六 七 十 年 代 ， 杰 文 斯 对 经 济 数据 的 多 个 序列 做 了 仔细 
研究 ， 最 终 得 出 这 样 的 结论 : 有 一 种 规律 的 商业 周期 ， 大 约 每 10.5 年 
被 一 次 主要 的 商业 危机 打 断 。 其 他 人 也 已 看 到 这 种 规律 ， 是 一 种 真正 
的 现象 ,他 使 用 了 18 世纪 晚期 到 19 世纪 70 年 代 来 自 多 个 出 版 源 的 数 
据 ， 甚 至 最 终 将 这 个 记录 回溯 至 包括 “南海 泡沫 ”的 1720 年 。 杰 文 斯 
第 一 次 查看 数据 的 时 候 ， 没 有 提供 接近 预测 时 间 的 恰当 危机 ， 但 却 发 
适当 时 间 至 少 发 现 小 型 危机 。 但 原因 是 什么 ? 
廉 : 赫 软 尔 很 久 以 前 就 提 到 ， 太 阳 黑 子 行为 的 主要 爆发 规则 可 
能 与 商业 周期 有 联系 ， 但 那些 追随 这 个 观点 的 人 受到 一 种 匹配 差错 的 
阻碍 。 太 阳 黑 子 周期 每 11.1 年 出 现 一 个 高 峰 一 一 至 少 大 家 是 这 么 认为 
的 一 一 那么 几 十 年 之 后 , 这 个 11.1 年 和 10.5 年 的 商业 周期 就 会 变 得 逐 
渐 不 同步 。 但 19 世纪 70 年代 中 期 , J. A. 布朗 做 了 研究 ， 将 太阳 黑子 
周期 从 11.1 年 修正 为 10.45 年 。 杰 文 斯 对 这 个 问题 的 态度 由 兴趣 变 为 
痴迷 ， 他 甚至 “改良 ”了 太阳 黑子 序列 。 当 序列 中 出 现 一 个 间隔 ， 通 
常 能 够 发 现 一 个 最 小 的 最 大 值 ， 那 就 是 杰 文 斯 能 够 接受 的 。 

有 些 联系 看 起 来 确信 无 疑 ， 而 且 那 时 杰 文 斯 也 发 现 ， 德 里 粮食 的 
价格 统计 中 存在 长 度 大 约 相 同 的 近似 周期 ， 这 就 是 例子 。 太 阳 行 为 可 
能 影响 气象 ， 这 貌似 有 道理 。 而 且 ， 这 种 效应 被 宣布 时 ， 看 起 来 也 符 
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合 印度 的 情况 ， 是 可 能 会 对 贸易 产生 影响 的 。 毕 竟 ， 格 拉 斯 哥 城 市 银 
行 的 失败 引起 了 1878 年 的 英国 危机 , 而 这 个 失败 源 于 最 近 的 印度 饥荒 
导致 的 贸易 萧条 。 因 为 英国 危机 看 起 来 跟随 着 德里 价格 序列 变动 了 好 
几 年 ， 所 以 这 个 理论 享受 到 了 解释 危机 滞后 的 红利 。 图 4-6 取 自 杰 文 
斯 最 后 的 论文 ， 这 篇 论文 发 表 在 1882 年 7 月 的 《自然 》 杂 志 上 (同年 
8 月 13 日 ， 杰 文 斯 死 于 一 次 意外 的 溺水 ， 享 年 46 岁 )。 这 张 图 显示 了 
太阳 黑子 序列 ( 沃 尔 夫 数 , Wolf's numbers )、 德里 的 粮食 价格 (“谷物 ”， 
corn )， 并 像 杰 文 斯 标 出 的 那样 标识 了 英国 的 主要 商业 危机 。 杰 文 斯 并 
未 有 意 筛 选 和 寻找 ， 以 便 选 择 并 重新 计算 这 些 数 据 ， 这 给 人 们 留 下 了 
深刻 的 印象 一 一 即使 未 能 吸引 所 有 观众 。 
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图 4-6 杰 文 斯 1882 年 的 图 表 ， 显 示 了 太阳 黑子 行为 和 商业 危机 之 
间 的 联系 (Jevons 1882 ) 








64 ， 统 计 学 七 支柱 














杰 文 斯 那 时 面临 着 嘲笑 。 他 在 1879 年 的 伦敦 统计 协会 会 议 上 发 
言 , 预期 经 济 会 在 未 来 一 两 年 内 复苏 ,“ 假 如 , 太阳 真 的 展现 出 适当 的 
黑子 数量 ”。 听 众 们 听 到 后 都 抑制 不 住地 大 笑 。 同 年 ,协会 《会 刊 》 刊 
登 了 两 篇 匿名 短文 ， 一 篇 关于 太阳 黑子 的 高 计数 如 何 帮 助 剑桥 大 学 在 
年 度 赛 艇 比赛 中 击败 牛津 大 学 ， 男 一 篇 关于 死亡 率 和 木星 运动 之 间 可 
能 存在 的 联系 。1863 年 ， 高 尔 顿 写 道 ,“ 行 使 偶尔 抑制 和 轻微 修正 的 
权利 ， 可 以 看 到 一 个 数量 有 限 的 观测 在 具有 先入 为 主 想法 的 人 手中 ， 
如 何 塑造 出 想 要 的 结论 , 这 真是 太 荒 雇 了 。” 当 然 , 即使 完全 良性 的 时 
间 序 列 也 能 够 表现 出 欺骗 性 的 模式 。1926 年 的 一 篇 题 为 “为 什么 我 们 
有 时 候 得 到 时 间 序 列 之 间 无 意义 的 相关 ? ”的 挑 峡 性 论文 中 ,乔治 。 
尤 德 尼 : 约 尔 展示 了 简单 的 自 相关 序列 如 何在 有 限 的 时 间 跨 度 上 表现 
周期 性 。 也 许 是 出 于 好 意 ， 他 没有 提 到 杰 文 斯 。 
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查尔斯 :达尔 文 很 少 使 用 高 等 数学 。1855 年 ， 他 给 老 朋友 ( 也 是 
他 的 表 兄 ) 威廉 达尔文， 福克斯 写 了 一 封 信 。 在 信 中 ， 他 用 一 种 说 
法 总 结 了 自己 的 观点 :“ 我 不 相信 任何 缺乏 真实 测量 和 三 分 律 ( Rule of 
Three) 的 事情 。” 这 种 说 法 后 来 因为 卡尔 . 皮尔 逊 而 声名 鹊起 。1901 
年 , 皮尔 逊 采 用 这 句 话 作为 新 杂志 Biometrika 的 座右铭 ; 而 1925 年 创 
办 Annals of Eugenics 时， 他 甚至 把 这 人 句 话 放 在 每 一 期 的 标题 页 上 《〈 如 
图 5-1 所 示 )。 这 是 皮尔 逊 能 在 达尔 文 的 著作 中 找到 的 、 最 接近 的 对 数 
学 的 认可 。 

在 评价 真实 测量 方面 ， 达 和 尔 文 确实 是 对 的 ， 但 他 对 三 分 律 的 信念 
却 是 错误 的 。 每 一 个 学 习 过 欧 几 里 得 五 卷 本 的 学 童 都 很 熟悉 达尔 文 引 
用 的 三 分 律 ， 这 是 一 个 简单 的 数学 命题 ， 如 果 a /b=c/4， 那 么 a、b、 
c、d 中 的 任何 三 个 都 足以 决定 第 四 个 。 对 于 达尔 文 来 说 ， 这 个 规律 是 
一 个 方便 的 外 推 工具 , 对 在 他 之 前 的 许多 人 也 是 如 此 ( 如 图 5-2 所 示 )。 
17 世纪 , £388 - 格兰特 和 威廉 ' 配 第 曾 用 这 样 的 比例 估计 人 口 和 经 济 
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行为 。18 世纪 和 19 世纪 初期 ， 皮 埃 尔 ' 西蒙 ' 拉 普 拉 斯 和 阿道夫 … 
凯特 勒 也 曾 这 样 做 。 

无 论 是 达尔 文 还 是 他 之 前 的 人 ， 都 没有 意识 到 三 分 律 的 分 析 基 础 
多 么 薄弱 。 在 分 派 商 业 交 易 和 欧 几 里 得 的 数学 问题 中 ， 这 条 规则 尚 可 
发 挥 作用 。 但 对 于 存在 变化 和 测量 误差 的 有 趣 科学 问题 ， 这 个 规则 就 
会 失效 。 这 些 情况 下 ， 三 分 律 会 给 出 错误 的 答案 。 结 果 中 会 有 系统 性 
偏差 .误差 或 许 还 会 特别 大 ， 而 其 他 方法 可 以 减 小 误差 。 这 个 事实 的 
发 现 出 现在 达尔 文 逝世 3 年 之 后 ， 是 统计 学 的 第 五 根 支 柱 。 发 现 者 是 
达尔 文 的 表 弟 弗 兰 西 斯 : m, fi 1885 年 9 月 10 日 在 苏格兰 阿 伯 
丁 宣布 了 这 项 影响 深远 又 令 人 惊讶 的 发 现 。 在 那里 ， 他 把 这 个 发 现 命 
名 为 “回归 ”。1885 年 之 后 的 半 个 多 世纪 的 时 光 中 ， 这 个 基本 概念 成 
为 统计 发 展 的 主线 。 这 个 发 现 的 故事 极 具 启发 性 ， 但 在 解释 之 前 ， 有 
必要 先 说 明 欧 几 里 得 的 错误 是 什么 ， 以 及 为 什么 这 个 错误 居然 可 以 持 
续 几 千年 。 
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图 5-2. 来 自 一 本 1825 年 的 教科 书 内 页 ， 达 尔 文 或 许 学 过 类 似 的 教 
科 书 。 注 意 所 用 的 案例 :“ 举 例 来 说 ， 按 3 英镑 19 先 令 11 
便士 一 准 司 的 价格 , R 144E 8 英 担 黄金 的 价值 。 英国 式 
的 测量 将 一 个 简单 的 外 推 变 成 需要 不 小 篇 幅 来 解决 的 问题 
(Hutton ca. 1825 ) 












































我 们 选择 高 尔 顿 考虑 过 的 一 个 案例 ， 这 个 案例 直到 今天 依然 是 人 
类 学 中 常见 的 问题 。 考 古 中 发 现 了 一 个 人 的 部 分 骨骼 ， 但 仪 仅 是 一 个 
长 为 7 的 大 腿 骨 ， 人 类 学 家 还 想 知 道 这 个 人 的 身高 卫 。 他 们 有 一 些 可 
以 用 来 比较 的 完整 骨骼 ， 给 出 一 组 配对 值 (7;, 到 )， 可 以 从 中 计算 算术 
平均 值 mr 和 mx。 高 尔 顿 的 计划 是 使 用 三 分 律 ， 从 这 些 均值 、 已 知 的 
了 以 及 关系 mr Imy — T LH RAR H 如果 这 个 关系 与 欧 几 里 得 考 
虑 过 的 问题 一 样 ， 在 数学 上 是 严格 的 ， 且 对 所 有 T; /H; 都 有 一 个 常数 
比值 ， 三 分 律 就 会 起 作用 。 但 在 这 里 ， 和 所 有 有 趣 的 科学 问题 一 样 ， 
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效果 会 发 生变 化 。 高 尔 顿 发 现 , 这 决定 了 三 分 律 并 不 适用 于 回归 现象 。 
在 一 种 极端 的 情况 下 ， 如 果 T 和 五 变化 ,但 仍 不 相关 ,五 的 最 佳 估计 
会 忽略 7, 是 mx 。 只 有 它们 完美 相关 时 ,， 欧 几 里 得 的 答案 才 正 确 。 在 
一 种 普通 的 情况 下 , 高 尔 顿 发 现存 在 一 个 普通 的 解 。 说 来 奇怪 , 从 7 预 
W 五 的 关系 明显 不 同 于 从 五 预 测 7 的 关系 , 而 且 两 者 都 不 符合 欧 几 里 
得 的 规律 。 








5.1 发 现 之 路 : 从 达尔 文 到 高 尔 顿 

















达尔 文 1859 年 发 表 的 物种 起 源 理 论 是 不 完整 的 ， 而 且 直到 1882 
年 他 去 世 的 时 候 ， 也 依然 不 完整 。 所 有 理论 出 现时 也 都 是 不 完整 的 ， 
因为 一 旦 理论 有 所 突破 ， 就 会 出 现 更 多 需要 解决 的 事情 。 因 此 ， 一 种 
理论 越 丰 富 就 越 不 完整 。 但 达尔 文理 论 的 缺憾 以 一 种 更 加 基础 的 方式 
表现 了 出 来 一 一 留 下 了 一 个 可 争议 的 问题 。 如 果 它 受到 广泛 的 注意 ， 
问题 就 出 来 了 。 这 个 问题 很 微妙 ， 直 到 达尔 文 逝 世 3 年 以 后 ， 高 尔 顿 
才刚 刚 发 现 一 种 解决 方案 ， 这 才 出 现 了 问题 的 完整 思考 和 表达 。 

这 个 问题 涉及 达尔 文 观点 的 基本 结构 ,为 了 使 进化 符合 自然 选择 ， 
这 种 理论 需要 这 样 的 基础 : 物种 内 必须 有 足够 的 可 遗传 的 变异 性 。 一 
个 亲 代 的 后 代 的 遗传 方式 必须 有 一 定 差异 ， 否 则 连续 的 世代 之 间 不 会 
发 生 任何 改变 。《 物 种 起 源 ;的 第 一 章 以 一 种 令 人 信服 的 方式 建立 了 这 
种 理论 ， 对 象 是 驯养 的 和 自然 的 动 植物 种 群 。 但 同时 ， 达 尔 文 无 意 中 
又 产生 了 一 个 问题 一 一 理论 中 的 一 个 明显 矛盾 。 

毫 无 疑问 ， 达 尔 文 在 世 时 只 有 两 位 读者 注意 到 了 这 个 问题 。 工 程 
师 弗 莱 明 - 詹 金 在 1867 年 的 一 篇 书评 中 谈 到 了 这 个 问题 ， 另 一 位 就 
是 10 年 后 的 高 尔 顿 。 詹 金 的 评论 仅仅 认识 到 了 这 个 问题 的 一 部 分 , 之 
后 就 将 注意 力 分 散 到 了 其 他 不 相关 的 一 组 问题 的 介绍 。1877 年 ， 高 尔 























































































































第 5 回归 : 多 元 分 析 、 贝 叶 斯 推断 和 因果 推断 | 69 
































顿 完全 阐明 了 这 个 问题 ， 并 把 它 视 为 一 个 严重 的 挑战 。 高 尔 顿 的 构想 
可 以 用 图 形 表示 。 达 尔 文 已 经 令 人 信服 地 确定 : 可 遗传 的 变异 通过 代 
际 转移 传递 给 后 代 〈 如 图 5-3 所 示 )。 








Generation 0 


Generation 1 


图 5-3 在 一 代 的 后 代 中 产生 的 变异 


























同一 个 亲 代 可 以 生育 遗传 特征 不 同 的 后 代 。 尽 管 高 尔 顿 只 是 泛泛 
地 考虑 了 这 个 问题 ,但 将 身材 作为 特征 来 考虑 的 想法 或 许 是 有 帮助 的 。 
成 年 身高 只 是 高 尔 顿 广泛 研究 的 一 个 特征 ， 考 虑 到 特征 的 已 知性 别 差 
5t. 女性 的 身高 会 放大 1.08 倍 。 但 是 ， 如 果 从 父母 到 子女 有 增加 的 变 
异 ， 那 后 代 会 怎么 样 ? 如 果 随 后 每 一 代 中 变异 都 增加 ， 这 个 相同 的 模 
式 会 不 会 持续 ( 如 图 5-4 所 示 ) ? 

























































































Generation O 


Generation 1 


Generation 2 











Generation 3 


图 5-4 ”经 过 三 代 增 加 的 变异 性 
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但 是 ， 短 期 内 无 法 观察 到 一 代 代 累积 起 来 的 增加 的 变异 。 一 个 物 
种 内 ,种 群 密度 在 随后 的 世代 中 几乎 相同 (如 图 5-5 所 示 )。 种 群 的 散 
布 在 短期 内 是 稳定 的 ， 事实 上 ， 这 种 稳定 性 对 定义 一 个 物种 来 说 是 必 
不 可 少 的 。 

















Generation 0 





Generation 1 





Generation 2 





Generation 3 


图 5-5 种 群 多 样 性 经 过 三 代 后 是 稳定 的 











无 论 在 自然 界 还 是 在 (缺乏 积极 育种 控制 的 ) 种 植 生产 中 ,今年 
庄稼 的 大 小 和 颜色 的 多 样 性 看 起 来 与 去 年 差不多 ， 前 年 也 是 。 没 有 饮 
食 上 的 显著 改变 时 ， 任 何人 类 种 群 从 一 代 到 下 一 代 在 身材 上 都 表现 出 
相同 的 变化 。 

高 尔 顿 提出 的 观点 并 非 关 于 物种 的 长 期 进化 ， 他 认为 ， 根 据 达尔 
文 给 出 的 理由 ， 显 著 性 的 改变 已 经 发 生 ， 或 者 即将 发 生 。 高 尔 顿 关心 
的 是 短期 。 他 考虑 达尔 文理 论 的 含义 ,其 至 称 它 为 “典型 的 遗传 "。 当 
时 间 尺 度 足 够 短 时 ， 至 少 可 以 认为 环境 中 有 一 个 近似 的 均衡 ,不 会 发 
生 任 何 突然 的 改变 。 即 使 在 近似 均衡 中 ， 达 尔 文 要 求 并 论证 过 的 变异 



































: 多 元 分 析 、 贝 叶 斯 推断 和 因果 推断 | 71 








T 














第 5 章 E 











性 的 存在 也 与 种 群 中 观测 到 的 短期 稳定 性 互相 冲突 。 除 非 能 够 发 现 某 
些 力量 可 以 抵消 增加 的 变异 性 ， 并 符合 遗传 的 代 际 变异 ， 否 则 达尔 文 
的 模型 行 不 通 。 发 现 这 种 力量 之 前 ， 高 尔 顿 研究 了 10 年 。 事 实 上 , 也 
是 他 的 成 功 才 拯 救 了 达尔 文 的 理论 。 

尽管 高 尔 顿 的 解决 方案 以 一 系列 模拟 的 模型 为 框架 ， 但 依然 明显 
是 纯 数学 式 的 。 因 此 ， 它 在 早期 生物 学 中 非常 独特 。 威 廉 ' 哈 维基 于 
算术 计算 发 现 了 血液 循环 ， 但 这 项 研究 还 是 偏 经 验 主义 的 。 许 多 早期 
的 科学 家 (例如 洛 伦 佐 : 贝 利 尼 和 阿 奇 博 尔 德 ， 皮特 凯 恩 ) 试图 创造 
一 种 数理 医学 ， 但 没有 成 功 的 记载 。 重 新 发 现 备 德尔 工作 的 20 年 前 ， 
高 尔 顿 在 不 了 解 遗传 学 的 条 件 下 ， 实 际 上 独立 得 出 了 备 德 尔 遗 传 学 的 
一 些 应 用 结果 。 

1873 年 ， 高 尔 顿 开 始 设计 使 用 “ 钉 板 ”( quincunx ) 这 种 装置 ， 用 
以 表达 代 际 变异 。 铅 粒 在 钉 板 中 经 过 一 行 行 钵 有 偏 置 销 的 靶子 降落 ， 
每 一 行 中 ， 铅 粒 随机 偏离 向 左 或 向 右 ， 直 到 落 入 底部 的 几 个 隔 间 之 一 
( 如 图 5-6 所 示 )。 









































图 5-6 最 初 的 高 尔 顿 钉 板 ,为 了 用 于 1874 年 的 一 次 公开 演讲 而 建造 
于 1873 年 。 底部 的 铅 粒 给 出 了 钟 形 曲 线 的 效果 ( Stigler 1986a ) 
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1877 年 ,他 进一步 发 展 了 这 种 想法 ,展示 了 连续 种 群 分 布 之 间 发 
生变 异性 的 效应 。 图 5-7 中 ,上 层 代表 种 群 分 布 。 就 是 说 , 对 于 第 一 代 ， 
矮小 的 身材 在 左 侧 ， 高 大 的 身材 在 右 侧 ， 大 致 上 呈 钟 形 正 态 分 布 。 
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图 5-7 1877 年 版 本 的 高 尔 顿 “ 钉 板 ”， 显 示 出 为 了 保持 恒定 的 种 群 
分 散 ， 人 靠近 顶部 的 倾斜 的 滑 道 如 何 补偿 了 下 方 增加 的 分 散 ， 
以 及 位 于 上 层 的 两 个 身高 群体 的 后 代 如 何 通过 这 个 过 程 追 
踪 到 下 层 

















为 了 保持 恒定 的 种 群 分 散 ， 高 尔 顿 发 现 有 必要 引入 他 所 谓 的 “ 倾 
PHRA” (inclined chutes ), 以便 使 其 在 服从 代 际 变异 之 前 压缩 分 布 。 
在 中 部 ， 高 尔 顿 以 图 示 展 现 了 这 种 变异 在 两 个 身高 相似 的 代表 性 群体 
中 的 效应 ， 一 个 在 中 部 ， 一 个 在 右 侧 。 每 一 个 群体 会 立即 在 下 面 产生 
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一 个 后 代 的 小 分 布 ， 表现 为 一 个 小 的 正 态 曲线 ， 其 面积 与 母 群体 的 大 
小 成 比例 。 为 了 保持 代 际 平衡 ， 他 精确 地 计算 了 滑 道 倾 斜 的 样子 (他 
称 为 “恢复 系数 ”: coefficient of reversion )。 但 是 ， 他 很 难 解释 它们 的 
形成 原因 。1877 年 ， 他 所 能 做 的 最 好 的 事情 就 是 ， 暗 示 它 们 可 能 代表 
了 一 个 较 小 的 生存 倾向 。 对 于 那些 远离 群体 均值 的 曲线 来 说 ， 这 意 
着 降低 的 适应 性 。 一 个 退 而 求 其 次 的 借口 是 ， 为 了 给 出 一 种 精确 的 平 
衡 ， 似 乎 要 求 存 在 一 定 水 平 的 巧合 。 这 个 情节 连 好 莱 坞 也 无 法 接受 ， 
高 尔 顿 自己 也 没 再 提起 。 

为 了 理解 高 尔 顿 最 终 给 出 的 解决 方案 ， 以 及 带 他 到 达 解 决 方案 的 
那个 奇妙 装置 ,可 参考 图 5-8 ( 先 关 注 左 侧 的 图 )。 这 是 他 发 表 于 1889 
年 的 一 幅 图 的 修饰 ， 这 幅 图 显示 了 一 个 中 部 CAO ) 有 截断 的 钉 板 。 现 
在 ， 铅 粒 在 半路 就 停止 了 。 如 果 不 受 打 断 ， 它 们 可 能 产生 的 轮廓 显示 
在 底部 (B )。 在 水 平 A 和 B 的 两 个 分 布 的 轮廓 是 相似 的 , 它们 的 区 别 
SIEF, PEKE CA) 画 得 更 粗糙 一 些 ( 这 是 我 加 上 去 的 )， 而 且 
比 低 水 平 (B) 更 紧凑 一 些 。 一 切 正在 预料 之 中 ,水 平 A 的 铅 粒 只 有 
大 约 一 半 的 变异 。 

高 尔 顿 观察 到 了 下 面 的 悖 论 。 如 果 你 在 单一 的 中 层 隔 舱 释放 铅 粒 ， 
如 图 5-8 左 图 箭头 所 示 ， 它 们 会 随机 落 到 左 侧 或 右 侧 ， 但 平均 会 直接 
落下 。 有 些 会 落 到 左边 ， 有 些 落 到 右边 ， 但 不 会 有 朝向 某 一 个 方向 的 
明显 倾向 。 但 如 果 我 们 看 更 低 的 隔 间 ， 比 如 左 侧 的 ， 释 放 所 有 中 间 层 
的 铅 粒 让 它们 落 到 底部 。 问 问 底 层 隔 间 的 这 些 “ 居 民 们 ”, 它们 是 从 哪 
里 落下 来 的 。 答案 不 是 “直接 从 上 面 落下 的 ”, 而 是 来 自 平 均 更 靠近 中 
部 的 地 方 (如 图 5-8 右 图 所 示 )! 原因 很 简单 。 比 起 那些 位 于 层 A 左 侧 
但 会 落 到 右 侧 的 铅 粒 , 更 多 层 A 中 部 的 铅 粒 会 落 到 隔 间 的 左 侧 。 因 此 ， 
从 不 同 立场 提问 这 两 个 问题 会 获得 根本 不 同 的 答案 。 或 许 ， 我 们 天 真 
期 待 过 的 简单 相互 作用 还 没有 找到 。 
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图 5-8 1889 年 示意 图 的 修饰 版 本 。 左 图 显示 铅 粒 从 上 层 隔 间 落 下 
的 平均 最 终 位 置 ， 右 图 显示 铅 粒 抵达 更 低 的 隔 间 的 平均 起 





始 位 置 


下 面 考虑 高 尔 
示 了 高 尔 顿 的 表格 
交叉 分 类 。 父 母 的 














(Galton 1889 ) 





顿 “ 钉 板 ” 和 他 收集 的 数据 之 间 的 联系 。 图 5-9 显 
， 给 出 来 自 205 组 父母 的 928 个 子女 的 成 年 身高 的 
身高 概括 为 “中 亲 ”( mid-parent ) 身高 ， 是 父亲 身 








高 和 放大 1.08 倍 的 母亲 身高 的 平均 。 女 性 后 代 的 身高 同样 放大 1.08 
wo 看 “成 年 的 儿童 总 个 数 ”( Total Number of Adult Children ) 这 个 列 。 


考虑 将 其 作为 钉 板 
述 的 分 组 。 表 格 中 


中 A 层 的 群 组 大 小 的 计数 ,对 应 最 左 侧 一 列 标签 描 
的 行 给 出 每 个 群 组 内 后 代 变 异性 的 历史 。 例 如 ， 在 





身高 标签 为 72.5 英寸 的 行 中 有 6 个 中 亲 ， 对 于 他 们 生育 的 19 个 子女 ， 





其 成 年 身高 范围 从 
显示 在 图 5-7 底部 


682 英寸 到 “以 上 ”(above )， 位 于 一 个 与 高 尔 顿 
的 小 正 态 曲线 之 一 类 似 的 模式 里 。 于 是 ， 每 一 行 显 























zw (原则 上 ) 一 个 这 样 的 小 正 态 曲线 ,然后 ,“ 总 和 ”( Totals ) 行 给 出 
加 总 计数 ， 即 显示 在 钉 板 底层 隔 间 的 计数 ( 图 5-8 中 的 层 B )。 
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如 果 人 的 身高 确实 与 “ 钉 板 ”显示 的 趋势 相似 ， 后 代 的 身高 应 访 
从 中 亲身 高 水 平 直线 下 降 。 表 格 右 侧 的 列 “ 中 位 数 ”( Medians ) 给 出 
了 每 一 个 中 亲 群 组 的 子女 中 位 数 身高 。( 每 一 个 像 小 正 态 曲线 的 群 组 ， 
毫 无 疑问 ， 要 从 未 分 组 的 数据 中 计算 。 ) 高 尔 顿 注意 到 这 些 中 位 数 并 不 



































是 直接 下 降 的 ， 相 反 ， 它 们 往往 更 接近 整体 的 平均 一 一 清晰 的 迹象 表 








明 倾 斜 槽 必然 在 那里 ! 可 以 肯定 ， 这 些 倾斜 构 是 看 不 见 的 ， 但 它们 正 
在 以 一 种 神秘 的 方式 执行 着 高 尔 顿 在 1877 年 示意 图 中 为 它们 安排 的 任 


务 。 高 尔 顿 给 出 一 张 示意 图 ( 如 








图 5-10 所 示 ), 清楚 地 展示 了 这 个 想法 。 





RATE OF REGRESSION UN DEREDITARY STATURE. 
ig (a) 





HEIGHT The Deviates of the Children are to those of DEVIATE 
n their Mid-Parents as 2 to 3. 
s 


72 
人 
71 When Mid-Parents are taller than mediocrity, 2 


their Children tend to be shorter than they. 


m 
inches 








6 
PH +s 
S iD 
S | 
x | H +2 

















ir Children tend to be taller than they. 


$ 
: H 
$ 3 
A When Mid Parents are shorter than mediocrity, E 
AR their 
e 


-3 








-4 











图 5-10 高 尔 顿 在 此 夯 出 图 5-9 的 最 左 侧 列 和 最 右 侧 列 的 数字 , 表明 
子女 身高 的 趋势 更 接近 人 群 的 平均 身高 ,而 不 是 他 们 中 亲 的 
加 权 平 均 身 高 。 这 是 一 种 “向 着 平庸 的 回归 ”( Galton 1886 ) 


看 了 列 的 中 位 数 ， 他 注意 到 了 相同 的 现象 :每 个 后 代 的 身高 群 组 





都 有 一 位 比 他 们 更 接近 中 间 值 












































(平庸 ) 的 平均 中 亲 。 高 尔 顿 还 认为 ， 























这 里 有 更 多 可 以 生育 超常 身高 的 后 代 的 普通 身高 的 父母 ， 而 不 是 更 多 
可 以 生育 更 少 极端 身高 的 子女 的 极端 身高 的 中 亲 。 但 是 ， 斜 槽 起 了 什 
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么 作用 ? 它 的 解释 是 什么 ? 

到 1885 年 , 高 尔 顿 有 了 更 多 证 据 支 持 这 个 现象 , DOPGUEDSDADER AE 
新 的 光芒 。 因 为 前 一 年 做 过 一 项 研究 ， 他 现在 拥有 许多 家 庭 的 数据 。 
于 是 ， 高 尔 顿 考虑 参照 已 经 研究 过 的 中 亲 及 其 子女 ， 以 同样 的 方式 考 
查 兄弟 之 间 的 数据 。 结 果 极 其 相似 ， 相 联系 的 模式 是 相同 的 ( 家 庭 的 
高 度 在 变动 )。 但 最 引 人 注 目的 是 ， 他 在 这 里 又 发 现 了 “回归 ”。 看 图 
5-11 右 侧 的 列 , 这 里 的 中 位 数 比 可 能 的 预期 更 加 系统 性 地 接近 “平庸”。 

他 的 表格 中 ， 兄 弟 之 间 没 有 指向 性 ， 即 没有 哪 位 兄弟 从 其 兄弟 那 
里 继承 身高 。 这 个 原因 很 简单 ， 结 果 也 很 特别 。 高 尔 顿 曾 使 用 他 的 各 
种 “ 钉 板 ”捕捉 排序 的 定向 流动 ， 而 这 里 没有 他 曾经 寻求 的 那 种 定向 
流动 。 兄 弟 数据 明显 对 称 。 除 了 拼写 错误 ， 他 必须 把 每 对 兄弟 的 数据 
重复 两 次 ,每 个 排序 中 各 列 出 一 次 。 图 5-11 的 左上 角 和 右 下 角 给 出 的 
“ 低 于 63 和 74 以 上 ”( below 63 and 74 and above ) 的 对 ， 必 须 是 相同 
的 两 个 个 体 。 在 这 里 ,“ 倾 斜 的 滑 槽 ”如 何 起 作用 ? 事实 上 ,这 里 似乎 
其 至 排除 了 “遗传 ”"。 高 尔 顿 认为 , 这 必然 是 明确 的 。 问 题 的 解释 必须 
是 统计 的 ， 而 不 是 生物 的 。 

高 尔 顿 返回 中 亲 和 子 女 的 数据 ， 对 计数 进行 了 光滑 处 理 ， 对 4 个 
格子 的 分 组 计数 计算 均值 并 四 侈 五 人 , 以便 更 好 地 发 现 模式 。 他 看 到 ， 
一 个 粗糙 的 椭圆 形 轮廓 出 现在 表格 最 密集 的 部 分 。 高 尔 顿 写 出 了 刻画 
钉 板 作用 的 一 个 数学 方程 ( 中 亲 总 体 可 以 视 为 一 个 正 态 分 布 ， 而 且 每 
个 子 群 的 后 代 都 可 以 看 作 一 个 离 差 相同 的 正 态 分 布 ), 而 且 借 助 了 一 位 
剑桥 数学 家 的 一 些 帮 助 ， 他 发 现 了 这 张 表 格 的 一 种 理论 表述 ， 就 是 我 
们 现在 确认 的 二 元 正 态 分 布 。 它 带 有 主轴 和 副 轴 ， 更 重要 的 是 ， 华 有 
两 条 “回归 线 ”( 如 图 5-12 所 示 )。 一 条 是 理论 上 的 线 ， 描 述 了 后 代 的 
期 望 身高 〈 线 OV)， 看 作 中 亲身 高 的 函数 ; 另 一 条 是 中 亲 的 期 望 身高 
( 线 OM )， 看 作 子 女 身高 的 函数 。 
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DIAGRAM BASED ON TABLE |I. 
(all female heights are multiplied by 1'08) 











MID-PARENTS ADULT CHILDREN 
TL their Heights , and Deviations from 68tinches. 
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图 5-12 ”高 尔 顿 1885 年 的 示意 图 , 展示 了 两 条 回归 线 ONM OM, “= 
分 律 ” 线 在 右 侧 的 小 示意 图 中 给 出 ， 即 线 OL (Galton 1886 ) 








这 种 统计 现象 的 本 质 逐 渐变 得 清晰 。 根 据 这 些 线 ， 无 论 从 二 元 密 
度 的 理论 版 本 出 发 ,还 是 从 表格 的 数值 版 本 出 发 ， 通 过 对 两 个 不 同方 
向 取 均 值 都 会 发 现 ， 除 非 所 有 数据 都 位 于 表格 的 对 角 线 上 ， 否 则 这 两 
条 线 不 可 能 一 致 。 除 非 这 两 个 特征 的 相关 系数 为 1 这 里 使 用 了 高 尔 
顿 在 1888 年 底 为 这 些 数据 引入 的 术语 “相关 系数 ”), 否则 这 两 条 线 必 
须 有 区 别 ， 并 且 每 条 线 必须 在 完美 相关 情况 ( 椭圆 的 主轴 ) 与 零 相关 
情况 〈 穿 过 中 心 的 水 平 线 或 垂直 线 ) 之 间 做 出 某 种 妥协 。 有 趣 的 是 ， 
达尔 文 的 示意 图 也 给 出 了 三 分 律 可 能 给 出 的 线 。 它 是 右 图 中 的 OL 线 ， 
既 不 符合 回归 线 ， 也 不 符合 任何 特殊 的 统计 解释 。 这 种 情况 下 ， 它 就 
是 简单 的 45° 对 角 线 ， 反映 了 中 亲 和 子 女 总 体 相等 的 平均 身材 。 





























5.2 高 尔 顿 的 解释 


高 尔 顿 1889 年 出 版 了 著作 Natural Inheritance， 他 在 其 中 总 结 了 
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这 个 研究 , 用 文字 表达 了 自己 的 想法 。 高 尔 顿 认为 ,如 果 P 是 总 体 的 平 
均 身材 , 那么 给 定 一 位 兄弟 的 身材 , 则 “未 知 的 兄弟 有 两 种 不 同 的 倾向 ， 
一 种 是 与 已 知 的 兄弟 相 一 致 ,而 另 一 种 是 与 他 的 种 族 相 一 致 。 一 种 倾向 
是 对 PP 的 偏离 和 他 的 兄弟 一 样 多 ， 而 男 一 种 趋势 则 是 毫 无 偏离 。 结 果 
就 是 妥协 ”。 按照 现代 术语 , 我 们 用 S1 和 52 表示 两 兄弟 的 身材 ,， 其 中 
每 人 的 身材 包含 两 个 成 分 ，S1=G+D1，S2=G+D2。 其 中 G 是 一 个 
不 可 观测 的 持续 性 成 分 ( 他 们 彼此 共同 持 有 的 一 种 基因 成 分 ), 对 两 兄 
弟 共同 起 作用 ; 而 D1 和 D2 是 不 可 观测 的 暂时 或 随机 成 分 ， 与 G 不 
相关 而 且 彼 此 也 不 相关 。 高 尔 顿 的 P 会 代表 总 体 中 所 有 G 的 均值 。 

于 是 ,我 们 可 以 把 回归 思想 表达 为 一 种 选择 效应 。 如 果 观 察 到 第 
一 位 兄弟 的 身材 S1 超过 了 总 体 平均 P, 那么 平均 而 言 , S1 可 能 的 偏离 
缘 于 这 两 种 原因 的 某 种 平衡 ， 因 为 一 个 个 体 的 G 的 变化 略 高 于 P， 同 
时 因为 D1 的 变化 略 高 于 0。 转 向 第 二 位 兄弟 时 ， 他 的 G 将 会 和 他 的 
兄弟 一 样 ,但 平均 起 来 ，D2 的 贡献 将 是 0, 所 以 S2 的 期 望 高 于 P, 但 
只 会 高 到 G 的 程度 ， 而 不 是 G+ D1， 因 此 没有 51 那么 多 。 而 日 颠倒 
S1 和 5S2 的 位 置 后 ， 同 样 的 观点 也 会 发 挥 作用 。 






























































































































































5.8. 达尔文 问题 的 解决 




















高 尔 顿 已 经 发 现 ， 向 均值 的 回归 不 是 生物 上 改变 的 结果 ， 相 反 ， 
这 是 亲 代 和 后 代 之 间 不 完美 相关 的 结果 。 并 且 ， 达 和 尔 文 认 为 ， 完 美 相 
关 的 缺失 是 一 个 必要 条 件 , 否则 不 会 有 代 际 变异 , 也 不 会 有 自然 选择 。 
之 前 我 给 出 的 理论 表示 ( 图 5-4) 的 绘图 最 好 包含 回归 ， 如 图 5-13 所 
示 。 图 5-13 和 图 5-4 的 差异 在 于 ， 前 者 认为 观测 到 的 身材 并 非 是 完全 
遗传 的 , 而 是 由 两 个 成 分 组 成 , 其 中 暂时 性 的 成 分 是 不 遗传 的 。 于 是 ， 
这 与 一 个 近似 的 进化 均衡 中 种 群 的 分 散 相 一 致 一 一 从 种 群 中 心 向 极端 
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值 的 运动 被 反 向 运动 所 平衡 。 因 此 ， 朝 向 极端 的 大 多 数 变异 是 缘 于 人 
口 稠密 的 中 间 部 分 的 短暂 运动 。 高 尔 顿 确认 的 问题 归根 结 底 不 是 一 个 
问题 ， 只 不 过 由 于 统计 效应 导致 之 前 无 人 确认 。 种 群 均衡 和 代 际 变异 
并 不 冲突 。 
































General tion O 
General tion 1 
General tion 2 
Genera! tion 3 








图 5-13 ”图 5-4 的 重 绘 ， 目 的 是 为 了 人 允许 回归 








5.4 影响 





高 尔 顿 对 达尔 文 问题 的 研究 发 挥 了 重大 影响 。 接 纳 达 尔 文理 论 的 
过 程 中 ， 他 扮演 了 重要 角色 。 高 尔 顿 解决 了 一 个 似乎 没有 人 完全 意识 
到 的 问题 , 而 且 展 示 出 完全 正确 的 理解 , 他 发 展 的 方法 在 20 世纪 早 
的 生物 学 中 非常 重要 。 高 尔 顿 介绍 了 相关 系数 和 简单 的 方差 成 分 模型 。 
事实 上 ， 他 仅 通 过 统计 的 方法 就 发 现 了 一 些 结果 ， 这些 结 果 在 1900 
年 因为 孟 德 尔 的 工作 而 重 获 发 现 。 比 如 亲 代 对 后 代 贡 献 的 定量 程度 ， 
再 比如 兄弟 之 间 的 联系 要 比 父母 子女 间 的 联系 更 紧密 。1918 年 ， 罗 纳 
德 . A. 费 售 尔 使 用 了 一 种 难度 极 高 的 数学 技巧 , 扩展 了 备 德 尔 分 配 的 
方差 计算 ， 从 相关 到 偏 相 关 ， 再 到 所 有 各 种 关系 。 这 样 就 产生 了 现代 


数量 遗传 学 。 
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影响 不 仅 发 生 在 生物 领域 。 方 差 成 分 思想 成 为 定量 心理 学 和 教育 
心理 学 的 关键 。 高 尔 顿 的 分 离 持久 效应 和 暂时 效应 的 思想 ， 是 经 济 学 
家 米尔 顿 ， 弗 里 德 曼 1957 年 出 版 的 著作 The Theory of the Consumption 
Function 中 提出 的 模型 的 核心 , 后 者 因此 获得 了 1976 年 诺 贝 尔 经 济 学 
奖 。 弗 里 德 曼 主 张 ， 个 人 消费 主要 依靠 个 人 收入 的 持久 成 分 ， 而 个 人 
消费 对 诸如 约翰 ' 梅 纳 德 2 E 的 暂时 增长 (“经 济 刺激 计划 ”) 
是 相对 不 敏感 的 。 他 由 此 得 出 结论 ， 基 于 “政府 临时 支出 会 产生 持久 
效应 ”的 相反 假设 而 得 到 的 S 是 错误 的 。 

































































5.5 ”多 元 分 析 和 贝 叶 斯 推断 


历史 学 家 们 忽略 了 高 尔 顿 这 个 发 现在 某 一 方面 的 影响 ， 而 这 个 方 
面 不 但 深远 ， 甚 至 可 以 说 更 有 影响 力 。 在 1885 年 高 尔 顿 的 工作 之 前 ， 
没有 工具 可 以 用 于 进行 真正 的 多 元 分 析 。 早 期 的 研究 者 们 考虑 过 多 维 
统计 分 布 。 图 5-14 展示 了 一 些 早期 二 维 误差 分 布 的 例子 ， 比 如 发 生 在 
打靶 射击 中 的 误差 , 图 5-15 展示 了 多 于 一 个 变量 的 早期 密度 公式 。 男 
外 , 首次 出 版 的 分 析 多 于 一 个 未 知 量 的 公式 可 以 追溯 到 1805 年 及 其 以 
前 的 最 小 二 乘 。 


-4 p 


图 5-14 二 元 密度 轮廓 ， 来 自 罗伯特 : 阿 德里 安 ( 左 侧 )、 奥 古 斯 
特 … MIE CAM) 和 伊西 多 尔 : 迪 迪 翁 (下 页 ) (参见 
Adrain 1808, Bravais 1846, Didion 1858 ) 
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Soit maintenant x = Ẹ Vn, y= V Vn g Vn es 
& 14, P — p, Y = Cc. on aura E+ Y +i + &c. 一” 
n n 
& A+ B + C &c. — 1; donc, 


I 


Cms) 
EL. - (+ E 3 +&e.) 


2) comme l'incrément oü la différence des quantités 
£s » té e(t = 1, la différence des variables E, v, ¢ &c. 


fera — ve & , par conféquent , infiniment petite ; de forte 





que, fi on appelle cette différence d 0, on aura 
d 67-7: 











E = S.m0.S.n9— (S.mOnQ); 
la double € précédente devient 


E (P. S. n —2all S. mOn. S m] 


gia. E L 
KP o nOn Gen. E 


x finu di " TR S s. E.S. mi m, 
s*a’ 


En prenant les intégrales dans les limites infinies positives et né- 
gatives , comme celles relatives à aw et a«', on aura 


ko BS nO —all S mOnO l.S, m» 
z.e gea R é (o) 
.VE 


Yl faut maintenant, pour avoir la probabilité que les valeurs de / 
et de / seront comprises dans des limites données, multiplier 
cette quantité par dl. d/', et l'intégrer ensuite dans ces limites. En 
nommant X cette quantité, la probabilité dont il s'agit sera donc 


























图 5-15 多 元 正 态 密度 的 发 表 公式 ， 来 自 拉 格 朗 日 (上 方 ) 和 拉 普 
拉 斯 (下方 ) (参见 Lagrange 1776, Laplace 1812 ) 




















但 1885 年 前 , 没有 人 考虑 过 分 割 连续 的 二 元 分 布 , 比如 寻找 和 和 
7 了 的 密度 。 给 定 了 的 对 的 条 件 分 布 和 给 定 卫 的 了 的 条 件 分 布 ， 在 正 态 
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情况 下 求 出 条 件 均值 和 条 件 方差 。 这 个 数学 步骤 很 简单 ， 但 显然 ,在 
高 尔 顿 之 前 没有 人 有 动力 去 实现 。 高 尔 顿 通过 遗传 研究 ， 考 虑 了 不 同 
条 件 下 二 元 关系 的 一 般 问 题 。 

正当 高 尔 顿 等 待 着 自己 1889 年 的 著作 步 人 出 版 流程 时 ， 他 意识 
到 ， 如 果 和 和 了 的 标准 差 相 等 ,那么 了 对 蕊 的 回归 和 斜率 与 对 了 的 回 
归 和 斜率 相等 ， 并 且 ， 它 们 共同 的 值 可 以 用 作 联 合 关系 的 测量 。 相 关系 
数 就 此 诞生 。 几 年 之 内 ， 弗 朗 西 斯 埃 奇 沃 思 、G 尤 德 尼 : 约 尔 和 皮 
尔 逊 把 这 种 思想 发 展 到 了 更 高 的 维度 ， 使 用 与 偏 相关 、 多 维 最 小 二 乘 
以 及 方差 的 主 成 分 有 关 的 联合 测量 ,统计 学 已 经 跳出 数字 的 二 维 表格 ， 
开始 作为 一 种 处 理 更 复杂 问题 的 技术 而 绒 露 头角。 




























































































5.6 贝 叶 斯 推断 


对 推断 来 说 ， 这 个 新 发 现 具 有 深刻 的 含义 。 从 根本 上 讲 ， 推 断 是 
结合 手边 数据 做 出 的 条 件 性 陈述 ， 通 常 根据 的 是 之 前 概括 的 公式 。 贝 
叶 斯 推断 是 一 个 典型 的 例子 ， 在 最 简单 的 形式 中 ， 它 相当 于 对 统计 学 
家 关心 的 未 知 值 9 指定 一 个 先 验 的 概率 分 布 p(06)， 以 及 对 给 定 9 的 数 
据 针 也 指定 一 个 分 布 , 也 就 是 似 然 函 数 工 (9)=p (x10)。 然后 找到 (X, 0) 
的 二 元 概率 分 布 ， 以 及 从 它 得 出 给 定 人 =x 时 9 的 条 件 概率 分 布 ， 即 
后 验 分 布 p (9 lx )。 至 少 我 们 现在 是 这 么 处 理 的 。 这 些 简单 的 步 又 在 
1885 年 以 前 还 是 不 可 行 的 。 高 尔 顿 的 “ 回 望 ”为 了 在 给 定 成 年 子女 的 
身高 时 找到 中 亲身 高 的 分 布 ， 或 者 在 给 定 一 个 兄弟 的 身高 时 找到 另 一 
个 兄弟 身高 的 分 布 ， 这 是 一 种 真正 的 贝 叶 斯 计算 ， 而 且 似 乎 是 第 一 次 
以 这 种 简单 形式 做 出 的 贝 叶 斯 计算 。 

当然 ， 这 种 或 那 种 的 逆 概 率 有 着 很 长 的 历史 ， 至 少 可 以 追溯 到 托 
马 斯 . 贝 叶 斯 (发表 于 1764 年 ) 和 拉 善 拉 斯 ( 发 表 于 17744 )。 但 无 
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论 是 他 们 还 是 其 他 人 ， 在 随后 的 年 代 中 ， 都 没有 给 出 符合 现代 约定 的 
形式 。 对 于 连续 变化 的 量 ， 他 们 中 间 没 有 人 使 用 条 件 分 布 ， 所 有 人 都 
用 了 假定 本 质 相 等 并 平坦 的 (均匀 的 ) 分 布 。 贝 叶 斯 只 考虑 了 推断 n 次 
独立 试验 中 的 二 项 概率 9 (在 单 次 实验 中 成 功 的 概率 ) 的 情况 。 其 中 ， 
他 假定 唯一 可 得 的 信息 已 经 成 功 发 生 ( 按照 我 们 的 术语 ) X R, FR 
WI n- XK. ike, 那里 没有 “ 先 验 ”, 但 他 调整 了 自己 的 分 析 ， 
说 它 相 当 于 相信 ( 缺乏 任何 经 验证 据 ) 邓 的 所 有 值 的 可 能 性 是 相同 的 。 
就 是 说 , 对 于 所 有 k=0、…、n 的 值 , Prob (X=k)=1/n+1)。 这 与 9 的 
均匀 先 验 相 一 致 ， 并 且 他 得 以 推理 出 一 个 正确 的 结论 ， 而 无 需求 助 于 
高 尔 顿 的 技术 支持 ， 但 这 些 只 能 在 二 项 分 布 这 样 狭窄 的 情形 中 成 立 。 
拉 普 拉 斯 的 处 理 方式 更 加 一 般 化 ， 他 使 用 了 一 个 毫 无 掩饰 的 假设 一 一 
p (909k ) 必 须 和 p(x19) 成 比例 ， 这 与 均匀 的 先 验 分 布 相 一 致 。 拉 普 拉 斯 
的 方法 尽管 没有 使 他 在 简单 的 问题 上 误 入 歧途 ， 但 却 让 他 在 更 高 的 维 
度 上 犯 了 严重 错误 ， 尽 管 这 一 点 他 也 许 从 未 意识 到 。 贝 叶 斯 在 整个 19 
世纪 都 受到 了 忽视 ， 大 多 数 人 不 加 鉴别 地 追随 着 拉 普 拉 斯 。 

大 多 数 人 认为 ， 贝 叶 斯 推断 是 理想 的 推断 形式 。 它 提供 了 科学 家 
想 要 的 精确 答案 : 根据 手头 的 数据 ， 完 整 描 述 一 项 研究 目标 的 不 确定 
WE. WMH, 许多 人 相信 ， 就 像 大 多 数 的 理想 一 样 ， 这 在 实践 中 是 达 不 
到 的 。 因 为 手边 的 构成 要 素 通 常 并 不 清晰 ， 特 别 是 先 验 概率 的 指定 。 
1885 年 后 , 数学 的 发 展 可 以 支持 更 一 般 的 思想 表述 , 但 依旧 困难 重重 。 
从 20 世纪 20 年 代 起 ， 哈 罗 德 . 杰 弗 里 主张 使 用 某 些 所 谓 的 “参考 先 
Jo". 这 种 先 验 分 布 带 有 一 定 的 不 确定 性 , 对 测量 尺度 并 不 敏感 , 并 合 
理 地 ( 至 少 对 某 些 人 ) 反映 了 缺乏 的 信息 。20 世纪 50 年 代 ， 布 鲁 
诺 . 德 . 费 奈 带 和 吉米 . 萨 维 奇 愿意 拥护 一 种 个 人 化 的 贝 叶 斯 推断 。 
在 他 们 那里 ， 每 位 统计 学 家 都 寻求 自己 的 真实 信念 评价 作为 先 验 ， 哪 
怕 每 个 人 的 先 验 不 同 会 导致 不 同 结论 。 最 近 ， 其 他 人 主张 一 种 “客观 
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的 ” 贝 叶 斯 方法 ， 在 这 种 方法 中 再 次 使 用 先 验 的 参考 以 表示 先 验 信息 
的 缺乏 。 统 计 学 家 寻求 可 以 得 到 这 样 知 识 的 其 他 方法 作为 补偿 ， 不 基 
于 强大 的 先 验 信息 ， 至 少 也 会 得 到 在 质量 上 相似 的 结论 。 高 维 的 问题 
更 严重 ,在 一 维 或 二 维 中 看 似 自然 的 假设 力量 到 高 维 中 就 是 难以 辨别 
的 。 并 且 ， 尽管 作 用 在 结论 上 的 效果 会 很 强 且 难以 预见 ， 却 有 可 能 获 
得 赞同 。 



































5.7 ”收缩 估计 




















高 尔 顿 工作 的 主要 成 就 是 引入 了 多 元 分 析 。 而 回归 人 悖 论 的 解释 却 
不 太 重 要 ， 也 不 太 成 功 ， 即 所 谓 高 个 的 父母 的 子女 不 会 太 高 ， 而 高 个 
子女 的 父母 却 不 太 高 。 缘 于 回归 的 错误 理解 而 发 生 的 失误 一 直 都 有 ， 
并 且 无 处 不 在 。 

1933 年 ， 西 北大 学 经 济 学 家 贺 拉 斯 塞 奎 斯 特 出 版 了 The Triumph 
of Mediocrity in Business 一 书 , 这 本 书 完全 建立 在 统计 错误 之 上 。 例如 ， 
他 观察 到 , 如 果 你 在 1920 年 列 出 利润 率 最 高 的 前 25% 的 百货 公司 , 并 
且 跟 踪 这 些 公 司 的 平均 表现 到 1930 年 为 止 ,那么 会 发 现 它们 的 业绩 表 
现 不 断 趋 于 行业 平均 值 ， 走 向 平 良 。 即 使 塞 硅 斯 特 知 道 回 归 ， 他 也 没 
有 理解 它 。 塞 奎 斯 特 这 样 写 道 :“ 在 商业 中 , 走向 平庸 的 趋势 不 仅 是 统 
计 的 结果 ， 更 表现 了 普遍 的 行为 关系 。” 他 浑然 不 觉 的 是 ， 如 果 根 据 
1930 年 的 利润 选择 前 25% 的 公司 , 效果 将 会 发 生 逆转 。1920~1930 年 ， 
业绩 表现 会 稳定 地 远离 平 良 。 贯 穿 这 本 468 页 的 书 ， 他 对 几 十 个 经 济 
部 门 分 别 重复 了 这 种 错误 言论 。 

20 世纪 50 年 代 ， 查 尔 斯 斯 坦 暴露 了 另外 一 个 有 关 的 悖 论 。 假 
定 有 一 组 独立 的 测量 总 =1、…、 大 ， 每 个 都 是 一 个 分 别 的 均值 y; 的 估 
计 。 这 些 j 可 以 是 完全 无 关 的 , 但 出 于 简化 考虑 ,假定 每 个 了 有 一 个 
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ES, 1) 分 布 。 这 些 X; 可 能 是 上 个 不 同人 标准 化 的 考试 得 分 ， 或 者 
不 同行 业 的 大 家 公司 利润 的 标准 化 估计 。 在 那 时 ,应 该 根据 对 应 的 歹 佑 
IREA us, 这 被 认为 是 太 过 明显 而 无 需 证 明 的 。 斯 坦 表明 这 是 错误 的 。 
如 果 采 用 估计 的 误差 平方 和 最 小 化 这 个 全 局 目标 ， 尤 其 通过 将 所 有 X; 
向 0 的 方向 收缩 ， 就 可 以 发 现 一 组 更 好 的 估计 。 收 缩 的 方法 是 利用 一 














个 只 依赖 于 各 个 大 的 量 , 例如 , 使 用 h : zx eps. 








XH BU EYE H LUSERES ARARPJUCAS E G k TMG ,五 )， 
考虑 所 有 X, 的 简单 线性 函数 的 可 能 的 估计 ， 即 任何 形 如 bX, 的 估计 。 
“明显 ”的 估计 恰好 是 b= 1 的 这 个 。 但 将 误差 平方 和 最 小 化 作为 目标 
时 ,如果 我 们 有 成 对 (wi, 凶 ) 作 为 数据 ， 那 么 5 的 最 佳 选择 会 是 在 互 上 
XuX, 
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hi 的 线性 回归 的 最 小 二 乘 佑 计 。 这 会 是 4b 





























如 何 确 定 它们 是 分 析 的 要 点 。 再 一 次 地 ， 我 们 能 估计 4。 的 分 子 。 这 是 
一 个 基本 的 练习 , 以 显示 E(X,)=E(X, - 1), 所 以 用 Z(X, — D 替换 
x(uX) ， 并 仅仅 使 用 5 = T zd I . 斯 坦 证 明 ， 这 给 出 了 
(在 此 所 用 的 假设 之 下 ) 比 起 "明显 的 ”估计 更 小 的 期 望 的 误差 平方 和 。 
无 论 1 是 什么 ， 只 要 上 不 太 小 即 可 (三 4 将 适合 这 里 给 出 的 估计 )。 
高 尔 顿 不 会 对 此 感到 惊讶 :“ 明 显 的 ”估计 天 落 在 线 E(X,|4)= a, E, 
这 是 他 已 经 识别 出 来 的 错误 的 回归 线 。 对 应 在 1 上 ,而 不 是 在 上。 









































5.8 因果 推断 





在 今天 ,“ 相 关 关 系 并 不 隐 含 因果 关系 "， 统 计 学 家 普遍 赞同 这 样 
的 陈述 。 这 个 版 本 的 陈述 甚至 早 于 1888 年 “相关 系数 ”的 发 明 。 哲 学 


























$853: 回归: 多 元 分 析 、 贝 叶 斯 推断 和 因果 推断 | 89 






































家 乔治 伯克利 1710 年 这 样 写 道 :“ 思 想 的 联系 并 不 隐 含 着 因 和 果 的 
关系 , 它们 只 是 标记 事物 的 一 个 记号 或 符号 。” 现代 技术 的 版 本 似乎 出 
现在 19 世纪 90 年 代 晚 期 。 在 一 个 调查 中 ， 皮 尔 逊 发 现 了 令 他 吃惊 的 
事情 。 男 性 头盖骨 的 长 度 和 宽度 本 质 上 不 相关 ， 女 性 的 头盖骨 也 是 如 
此 。 但 如 果 将 男性 和 女性 的 头盖骨 混在 一 起 ， 情 况 就 变 了 了 。 对 于 这 个 
合并 的 组 ， 由 于 两 组 均值 不 同 ， 因 此 那些 相同 的 测量 表现 出 显著 的 正 
相关 性 。 在 他 的 描述 下 , 平均 而 言 , 男性 在 两 个 维度 上 都 要 更 大 一 些 。 
考虑 ( 在 一 种 极端 的 情况 下 ) 把 合并 的 组 画 成 两 个 不 相交 的 圆 徐 ,分 
开 显示 时 没有 关系 ， 但 合 起 来 就 会 显示 出 它们 的 中 心 决定 的 关系 。 
皮尔 逊 将 这 称 为 “虚假 相关 "”， 他 写 道 : 










































































这 种 相关 性 完全 可 以 称 为 “虚假 的 ”, 但 保证 任何 社会 的 
绝对 同 质 性 几乎 是 不 可 能 的 ， 因 此 我 们 的 相关 结果 总 会 倾向 
于 犯错 ， 其 数量 无 法 预言 。 而 那些 坚持 把 所 有 相关 关系 都 看 
成 因果 关系 的 人 ， 通 过 将 两 个 密切 同 源 的 种 群 人 工地 混合 在 
一 起 ,可 以 在 两 个 非常 不 相关 的 特征 A 和 B 之 间 产 生 相关 性 ， 
这 样 的 事实 必然 引 来 相当 大 的 震动 。 


长 期 以 来 ， 人 们 广泛 接受 这 个 问题 ， 却 也 同时 强烈 希望 接受 相反 
的 观念 ， 认 为 找到 一 种 相关 就 有 助 于 支持 某 种 程度 的 因果 联系 推断 。 
当然 ， 其 中 的 一 些 愿望 是 自欺欺人 ， 尤 其 当 一 位 对 因果 关系 抱 有 强烈 
先 验 信 念 的 科学 家 对 于 自己 的 结论 做 出 发 现 相关 性 的 不 严谨 陈述 的 时 
候 。 但 这 些 年 来 ， 一 系列 统计 技术 发 展 起 来 ， 通 过 潜在 允许 这 样 的 陈 
述 一 一 诸如 “如 果 这 些 假设 可 以 满足 ， 那 么 相关 性 并 不 隐 含 因果 关 
系 ”一 一 为 因果 推断 提供 了 方法 ， 继 而 衍生 了 一 系列 随 着 使 用 方法 变 
动 的 条 件 。 

其 中 的 某 些 条 件 ， 与 其 说 是 数学 的 ， 不 如 说 是 哲学 的 。1965 年 ， 
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奥斯汀 





: 布 莱 德 福 : 希 尔 给 出 了 一 个 系列 条 件 ， 包含 7 个 一 般 性 陈述 。 


他 认为 这 些 足 够 应 付 流行 病 学 中 的 因果 推断 。 这 些 条 件 都 是 实际 可 用 
的 ， 并 没有 试图 做 出 严格 的 定义 ， 而 使 用 了 “力量 ”和 “关系 的 一 至 
性 ”“ 可 能 ”和 “联系 的 继承 性 ”这 样 的 术语 。 这 7 个 条 件 中 ， 有 一 个 
被 他 称 为 “时 序 性 ”, 在 本 质 上 陈述 了 声称 的 原因 必须 先 于 结果 。 但 是 ， 
这 些 条件 尽 管 看 起 来 在 生物 学 或 物理 学 中 是 合理 的 ,但 在 社会 科学 中 
的 作用 尚 不 明确 。 西 蒙 ' 纽 康 在 一 本 政治 经 济 学 教科 书 中 给 出 过 一 个 
反例 ， 比 希 尔 的 系列 条 件 发 表 还 要 早 80 年 : 

















这 种 看 待 经 济 现象 的 方法 ( 即 假定 的 时 序 性 ) 如 此 自然 ， 


因此 需要 举证 它 的 危险 性 的 某 些 表现 。 假 定 有 这 样 一 位 研究 


者 ， 


他 通过 统计 观察 试图 了 解 硅 宁 和 公共 健康 之 间 的 关系 。 





这 位 研究 者 可 能 会 这 样 推理 :“ 如 果 硅 宁 有 益 于 间 葡 热 的 治 
疗 ， 那 么 在 人 们 摄 入 最 多 硅 宁 的 那些 地 区 ， 间 歌 热 会 最 少 。 


随 着 每 一 次 新 的 硅 宁 进口 ， 将 会 带 来 公共 健康 的 发 展 。 但 实 
际 上 ， 我 们 的 发 现 恰 恰 相 反 。 沿 密西西比 河谷 的 低地 以 及 海 
湾 国 家 湿地 生活 的 人 们 ， 比 国内 其 他 地 区 的 人 摄 入 更 多 的 村 
宁 。 但 他 们 远 远 谈 不 上 更 健康 ， 比 起 其 他 人 ， 他 们 遭受 了 更 
多 的 间 歌 热 。 不 仅 如 此 ， 我 们 还 发 现 套 宁 的 大 规模 进口 发 生 
在 每 年 的 夏天 ， 接 着 到 了 秋天 ， 间 砍 热 发 病 的 频率 就 规律 性 
地 增加 。” 





我 们 的 预见 能 力 确实 在 使 事情 复杂 化 。 


其 他 更 严格 的 方法 包括 数据 相互 依赖 的 假设 结构 ， 比 如 ， 某 些 

















偏 相关 是 0; 或 给 定 某 些 变量 ， 其 他 一 些 变量 是 条 件 独 立 的 ; 再 或 者 ， 
引入 反映 假设 因果 性 的 “结构 方程 "。1917 年 ， 休 厄 尔 … 赖 特 发 现 ， 构 





建 不 同 变量 之 间 的 有 向 图 将 相依 的 每 个 方向 用 一 个 箭头 表示 ， 只 要 网 
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中 没有 环 ， 就 能 轻松 计算 成 对 相关 系数 (如 图 5-16 所 示 )。 随 后 ， 他 
把 这 个 方法 称 为 “路 径 分 析 ”。 赖 特 最 初 的 工作 是 研究 孟 德 尔 的 遗传 结 
构 ， 这 在 本 质 上 是 数学 的 ， 而 非 因 果 的 。 但 是 ， 他 在 后 来 的 工作 例子 
中 引入 了 因果 推 新 。 最 早 的 一 项 应 用 是 在 1917 年, 可 以 用 来 解决 皮尔 
逊 讨论 过 的 问题 。 令 工 为 头盖骨 长 度 ， 丈 为 头盖骨 宽度 ，$S 为 性 别 CM 
RAF) 那么 , 他 的 方法 应 用 于 混合 的 头盖骨 ， 则 产生 下 面 的 协 方差 
关系 : 
Cov(L, W) = E(Cov(L, W | S)} + Cov(E{L | S}, E(W | S3) 

皮尔 逊 认 为 ， 右 侧 的 第 一 项 会 接近 0， 两 个 子 群 均值 之 间 的 关系 

(第 二 项 ) 占据 支配 性 的 地 位 。 














图 5-16 休 厄 尔 : 赖 特 1917 年 的 第 一 个 路 径 分 析 ， 根 据 1975 年 4 
月 赖 特 和 作者 的 私人 通信 重新 画 出 (Wright 1975 ) 














赖 特 的 方法 成 为 后 来 很 多 工作 的 先驱 ， 包 括 无 环 图 的 因果 模型 ， 
以 及 经 济 学 家 的 结构 方程 模型 。 许 多 现代 工作 都 是 沿 着 这 个 脉络 组 
织 的 一 一 从 强大 的 假设 推导 严格 的 结论 一 一 然而 也 面临 着 强烈 的 警 
告 ， 这 种 假设 通常 不 像 孟 德尔 的 遗传 例子 中 那样 明显 真实 。 
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5.9 三 分 律 : 愿 你 安息 


到 19 世纪 末期 ,三 分 律 已 经 被 丢 入 数学 史 的 垃圾 箱 。 今 天 , 无 论 
数学 专业 的 学 生还 是 教师 ， 都 基本 上 不 了 解 由 它 命名 的 定律 。 而 且 ， 
这 个 名 字 偶 尔 会 用 到 其 他 无 关 的 地 方 ， 从 未 收获 过 多 少 人 追随 。 那 个 
经 常 受到 引用 的 问题 ,“ 节 稣 会 士 会 三 人 一 组 地 去 死 吗 ? " (Do Jesuits 
die in threes? 受到 这 样 一 个 事实 的 鼓舞 ， 随 机 事件 似乎 只 会 随机 地 聚 
集 在 一 起 ) 已 经 是 如 今 大 多 数 统计 学 家 最 接近 术语 “三 分 律 ” 的 时 候 
To RẸ Annals of Eugenics 封面 上 ， 皮 尔 逊 对 达尔 文 1855 年 陈述 的 
重复 还 在 。 杂志 在 1954 年 更 名 为 Annals of Human Genetics , 并 在 1994 
年 重新 设计 了 封面 ， 这 个 重复 引用 才 终 于 消失 。 在 这 个 对 三 分 律 不 再 
关心 的 世界 上 , 无 人 户 蛋 它 的 消失 , 其 至 其 消失 受到 了 无 条 件 的 欢迎 。 
但 这 个 责任 不 需要 由 高 尔 顿 承担 。 数 学 自身 的 成 长 和 发 展 使 得 三 分 律 
逐渐 成 为 代数 中 一 个 次 要 部 分 ， 其 至 不 值得 获得 一 个 命名 。 它 曾 是 每 
本 数学 教材 指定 的 部 分 ， 是 英国 公务 员 考 试 的 要 求 。 但 即使 这 个 名 称 
已 经 死去 ， 这 种 思想 的 统计 误 用 依然 不 断 出 现在 常见 的 考虑 不 周 和 天 
真 的 外 推 法 之 中 。 

即使 在 三 分 律 的 全 盛 时 期 ， 公 众 对 此 也 抱 有 一 种 翡 观 的 看 法 。 而 
且 ， 它 可 能 驱使 许多 学 童 离开 了 数学 ， 就 像 今天 很 难 讲授 的 三 角 和 微 
积分 。1850 年 , 约翰. 赫 软 尔 已 经 在 一 本 书评 中 承认 了 三 分 律 应 用 的 
局 限 性 , 即使 他 当时 还 不 知道 高 尔 顿 的 看 法 :“ 三 分 律 已 经 不 再 是 政治 
数学 家 们 的 最 后 希望 ， 也 不 再 是 一 一 在 规则 由 来 已 久 的 领域 中 通过 给 
出 武断 的 或 不 必要 的 假设 一 一 促使 内 容 简化 从 而 得 到 解决 的 问题 。 

1859 年 ， 一 部 戏剧 被 弗 兰 西 斯 : 塔 尔 福 德 冠 以 “三 分 律 ” 的 名 字 ， 
在 伦敦 短暂 上 演 。 这 是 一 部 单 幕 喜剧 ， 剧 中 男子 希 束 伯 尔 怀疑 自己 可 
爱 的 妻子 玛 格 丽 特 容易 受到 其 他 男人 的 诱惑 ， 他 筹划 着 暗中 破坏 一 个 
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事实 上 根本 不 存在 的 关系 。 希 蕊 伯 尔 的 密谋 使 他 几乎 失去 自己 的 妻子 ， 
但 最 终 皆 大 欢喜 。 这 部 戏 以 玛 格 丽 特 为 他 朗诵 的 一 首 诗 结束 ， 这 首 诗 
反映 出 , 即使 在 作为 人 生 指南 的 年 代 , 三 分 律 具有 的 可 信 度 也 比较 低 : 











你 会 做 得 很 好 ， 只 要 将 诡计 技 在 一 边 ， 
女人 的 荣誉 是 心灵 的 最 佳 指南 。 

要 可 靠 ， 也 要 信任 ， 永 远 铭 记 这 一 点 ， 
怀疑 另 一 半 之 前 ， 或 许 她 已 经 消失 不 见 。 
什么 填补 了 空缺 的 位 置 ? 啊 ， 谁 人 可 以 诉说 ? 
背 信 弃 义 者 的 不 义 之 举 终 将 平息 ， 

全 部 的 婚 后 生活 永远 不 能 

由 任何 三 分 律 来 制定 ， 来 检验 。 


第 6 章 


设计 : 实验 方案 和 随机 化 的 作用 


第 六 根 支柱 是 设计 ， 例 如 实验 中 的 设计 。 但 这 个 术语 受到 了 更 广 
泛 的 解释 ,包括 一 般 的 观测 计划 、 决 策 结果 分 析 以 及 执行 方案 。 设计 











包括 积极 实验 的 计划 、 研 究 规模 的 决定 、 问 题 的 设计 以 及 处 理 的 安排 ， 
还 包括 田野 试验 和 抽样 调查 、 质 量 监督 和 临床 试验 ， 以 及 在 实验 科学 
中 的 政策 和 策略 评价 。 所 有 这 些 情 况 下 ， 方 案 受 到 预 分 析 的 指导 。 设 
计 甚 至 会 在 被 动 观测 的 科学 中 发 挥 关键 作用 ， 那 些 领域 很 少 或 不 会 控 
制 数据 的 生成 。 如 果 你 有 能 力 生 成 数据 以 解决 手边 的 主要 问题 ， 那 么 
你 会 寻求 什么 样 的 数据 ? 思考 这 样 的 问题 可 以 使 任何 观测 研究 的 关注 
变 得 更 清晰 。 因 此 ， 设 计 可 以 在 任何 统计 问题 上 训练 我 们 的 思维 。 











一 些 设计 的 例子 很 古老 。《 
食用 尼 布 甲 尼 撒 王 赏赐 的 丰盛 ; 








HAEE :但 以 理 书 》 中 , 但 以 理 拒绝 

















Fi ,提出 按照 犹太 教 的 规定 食用 洁 食 。 




















国王 的 代表 接受 了 但 以 理 的 建议 ， 这 在 本 质 上 是 一 种 临床 试验 : 整整 
10 天 ,但 以 理 和 他 的 三 个 同伴 只 吃素 食 、 饮 清水 ， 接 着 比较 他 们 和 另 
一 组 人 的 健康 一 一 那 组 人 只 吃 国王 的 丰盛 饮食 。10 天 后 通过 外 观 判定 
两 组 人 的 健康 ， 最 后 但 以 理 这 一 组 赢 了 。 

阿拉 伯 医 学 家 阿 维 森 纳 〈 伊 本 西 纳 ) 在 公元 1000 年 前 后 写 过 
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Canon of Medicine， 这 本 书 中 讨论 了 有 计划 的 医学 试验 。 随 后 的 6 个 
世纪 ， 阿 维 森 纳 的 论著 在 医学 中 一 直 占 据 领先 地 位 。 在 这 部 书 的 第 二 
卷 中 ， 他 列 出 了 医学 试验 的 七 个 原则 。 这 些 原则 根据 亚 里 士 多 德 的 古 
老 思 想 进行 提炼 , 将 药物 作用 归 因 于 四 项 基本 特性 ( 热 、 冷 . 湿 \、 干 )， 
阿利 斯 泰 尔 . 克隆 比 将 这 七 项 原则 翻译 如 下 。 

(1) 药物 必须 避免 受到 任何 外 来 的 、 偶 然 特 性 的 影响 。 例 如 , 我 们 
不 能 在 水 被 加 热 时 测 它 的 作用 ， 而 应 该 先 等 它 冷却 。 

Q) 进行 实验 的 疾病 必须 选择 简单 的 而 非 混合 的 。 因 为 在 第 二 种 情 
况 中 ,不 可 能 从 药物 的 治疗 中 推断 治愈 原因 。 

(3) 必须 通过 两 种 类 型 相反 的 疾病 测试 药物 。 因为 ,有 时 药物 通过 
其 本 身 的 特性 治愈 一 种 疾病 ， 而 通过 偶然 的 特性 治愈 另 一 种 ， 所 以 不 
能 因为 它 治愈 了 某 一 类 型 的 疾病 ， 就 简单 推断 这 种 药物 必然 具有 某 种 
特性 。 

(4) 药物 的 药力 必须 匹配 疾病 的 力量 。 例 如 ， 有 一 些 药物 的 “ 热 ” 
少 于 某 类 疾病 的 “ 冷 ”", 那么 这 些 药物 对 此 类 疾病 无 效 。 因 此 ， 实 验 应 
该 先 对 较 弱 类 型 的 疾病 进行 ， 再 对 强度 逐渐 增加 的 疾病 进行 。 

(5) 必须 观测 活动 的 时 间 ， 这 样 才 不 会 混淆 本 质 和 偶然 性 。 例 如 ， 
热 水 因 为 获得 了 外 在 的 偶发 事件 ， 会 暂时 有 具备 加 热效应 。 但 一 段 时 间 
之 后 ， 它 就 会 回 到 寒冷 的 本 质 。 

(6) 必须 看 到 ， 药 效 会 常 第 发生, 或 在 许多 情况 下 发 生 。 因 为 如 果 
没有 出 现 这 种 效果 ， 那 就 说 明 这 种 作用 是 偶然 的 。 

(7) 实验 必须 对 人 体 完成 。 因为 对 狮子 或 马 测试 药物 不 会 证 明 对 人 
可 能 有 任何 作用 。 

我 们 可 以 使 用 现代 眼光 这 样 解读 这 些 规则 : 它们 强调 控制 和 复制 
的 必要 性 ， 强 调 混合 效应 的 危险 性 ， 以 及 强调 对 多 个 不 同 因子 水 平 效 
应 的 观测 智慧 。 人 们 甚至 可 以 把 这 些 规则 看 成 一 般 因 果 推 理 的 早期 表 
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达 方 式 。 从 阿 维 森 纳 开 始 , 有 什么 事情 改变 了 吗 ? 或 者 对 同样 的 问题 ， 
从 亚 里 士 多 德 开 始 算 起 呢 ? 好 吧 ， 老 鼠 已 经 取代 狮子 ， 成 为 实验 室 动 
物 的 首选 。 但 再 来 看 看 阿 维 森 纳 的 第 二 条 准则 。 他 说 ， 实 质 上 一 次 只 
要 做 一 个 因素 的 试验 。 对 此 ， 威 廉 姆 - 斯 坦 利 - 杰 文 斯 在 1874 年 的 
《科学 原理 》 中 有 一 个 更 现代 的 版 本 。 他 这 样 写 道 : 











ii 


























“实验 中 最 重要 的 预防 措施 之 一 是 ,每 次 只 能 改变 一 种 情 
况 ， 同 时 要 严格 保证 所 有 其 他 情况 不 变 。 


现在 读 一 下 费 舍 尔 ， 他 1926 年 这 样 写 : 


“我 们 必须 每 次 只 向 大 自然 提 很 少 的 问题 ， 或 者 可 能 的 
话 ， 只 问 一 个 问题 。 没 有 与 田间 试验 有 关 的 哪 一 句 格言 比 这 
一 名 会 更 被 频繁 地 重复 。 但 笔者 RER ) 确信 这 个 观点 完全 
错误 。 他 认为 ,， 大 自然 会 对 一 个 逻辑 严密 、 思 卡 周 全 的 调查 问 
沽 提供 最 好 的 答案 。 EXE, 如果 我 们 只 向 她 问 一 个 问题 , 大 
自然 通常 会 拒绝 回答 ， 直 到 其 他 一 些 主 题 也 被 一 起 讨论 。” 


6.1 可 加 模型 


费 舍 尔 放弃 了 2000 年 来 大 部 分 实验 的 哲学 与 实践 观点 ,使 用 了 一 
种 具有 伟大 独创 性 的 统计 观点 。 费 舍 尔 的 多 因子 设计 孕育 于 他 在 罗 和 森 
斯 塔 特 实 验 站 的 农业 研究 经 验 ， 彻 底 改 变 了 实验 过 程 。 在 相同 的 农业 
地 块 上 ， 他 会 同时 改变 种 子 、 肥 料 和 其 他 因素 ， 种 植 在 拉丁 方 阵 或 希 
腊 -拉丁 方 阵 这 样 的 阵列 上 , 并 回答 所 有 这 些 因素 对 单个 种 植 季 、 单个 
种 植 阵列 的 问题 。 

多 年 来 ， 农 业 实验 者 已 经 尝试 过 各 种 安排 。1770 4E, PEZ : 杨 提 
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出 了 同时 运用 于 相同 地 块 的 比较 方法 。 例 如 ， 比 较 播 种 与 畦 植 ， 同 时 
需要 避免 受到 其 他 变化 因素 的 误导 。 但 是 ， 杨 几乎 没 提 该 如 何 分 割地 
块 ， 只 是 说 了 “相等 的 "。 到 1919 年 费 舍 尔 抵达 罗 森 斯 塔 特 时 ， 那 里 
的 研究 人 员 使 用 的 是 棋盘 格 和 夹层 设计 ， 目 的 是 使 两 种 不 同 的 处 理 地 
块 彼此 相 邻 ， 从 而 最 小 化 土地 差异 。 可 以 说 ， 这 是 区 组 的 一 种 尝试 ， 
尽管 这 些 实验 缺乏 允许 这 种 区 组 效应 的 分 析 。 费 舍 尔 提供 的 分 析 和 实 
验 逻 辑 的 组 合 是 细 新 的 。 他 不 仅 认 识 到 ， 农 业 中 的 统计 变异 产生 了 必 
要 的 新 方法 ; 还 看 到 ， 如 果 执 行 有 经 济 效率 的 试验 ， 考 查 变 异 也 会 指 
向 答案 。 而 费 舍 尔 的 思想 中 , 令 人 印象 最 深刻 的 部 分 在 于 他 使 用 的 复 
杂 设计 一 一 既 结 合 了 层次 结构 ， 还 允许 估计 交互 作用 ， 而 收益 已 经 存 
在 于 一 个 更 简单 的 水 平 上 。 

下 面 考 虑 对 一 块 实验 田 上 的 作物 产量 使 用 一 个 可 加 模型 。 田 地 分 
制 成 一 些 ( 比如 说 TxJ 个 ) 地 块 ， 每 个 地 块 安排 不 同 处 理 的 组 合 。 可 
以 使 用 代数 方法 表达 模型 ,用 7 表示 地 块 ( i, ) 的 作物 产量 ,并 假设 
产量 是 总 体 均 值 的 简单 加 总 一 一 各 种 处 理 单独 的 效应 以 及 每 个 地 块 的 
随机 变动 。 对 i=1、…、IT 和 j=1、…、J, SY =u+a, +p, +E, 其 
中 代表 整 块 田地 的 平均 收益 ，a 代表 种 子 的 种 类 i 的 效应 ，p, 代 表 
了 肥料 水 平 j 的 效应 , 地 块 (i,j ) 的 随机 变动 s 则 归 因 于 不 可 控 的 因素 。 

1885 年 ， 弗 朗 西 斯 . 埃 奇 沃 思 对 这 种 可 加 模型 提出 一 个 相关 的 
口头 描述 。 该 描述 的 数学 化 程度 没 这 么 高 ， 但 表达 得 既 雄 办 又 明晰 ， 
拥有 一 种 形式 化 模型 无 法 企及 的 美 。 埃 奇 沃 思 写 道 : 



























































































































































“由 于 温和 的 地 质 作 用 ， 若 干 台地 产生 了 一 个 城市 的 选 
址 。 台 地 从 东 至 西 彼此 平行 。 火 山 岩 的 位 移 产 生 山 关 ， 山 贿 
重 直 分 割 人 台地。 我 们 或 许可 以 猜测 ， 火 山 以 恒定 的 速率 从 西 
向 东 运 动 ， 每 年 产生 一 座 宽度 相同 的 山 背 。 在 观测 之 前 ， 我 
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们 尚 不 知道 ，( 任何 一 块 或 所 有 台地 ) 一 年 的 位 移 是 否 与 近 几 
年 的 位 移 差不多 。 类 似 地 ， 我 们 也 不 知道 ， 一 块 人 台地 的 位 移 
是 否 与 相 邻 的 台地 趋同 。 于 是 ， 地 面 上 建 起 了 纵横 交错 的 各 
式 房 屋 。 每 个 屋顶 的 海拔 高 度 都 可 以 根据 气压 或 其 他 方法 确 
定 。 每 英亩 的 屋顶 平均 海拔 高 度 都 有 登记 。 











ERE, Y, ÆRE, j) EPERFA, u 是 整个 城市 的 
房屋 平均 海拔 高 度 ，w; 是 台地 i 上 的 地 面 位 移 效 应 ，pB, 是 山 消 j 的 地 
面 位 移 效 应 ，& 是 在 英亩 (i,j ) 中 距离 该 英 雷 的 房屋 高 度 均 值 的 变 差 。 

其 要 点 是 ， 这 个 模型 以 结构 化 的 方式 结合 了 3 种 变异 的 来 源 。 这 
种 方式 允许 它们 分 别 受到 处 理 ， 即 便 没 有 哪 两 个 地 块 的 处 理 组 合 会 完 
全 相同 。 在 一 个 模型 中 综合 所 有 这 些 变异 ， 会 产生 巨大 的 优势 。 如 果 
在 某 种 方法 中 , 数据 遗漏 了 某 个 因素 ( 例如 肥料 或 山 誉 ), 那么 这 种 遗 
漏 引起 的 变异 会 使 其 他 因素 和 不 可 控 因 素 引 起 的 变异 变 小 ， 从 而 使 其 
也 因素 〈 例如 种 子 种 类 或 台地 ) 的 检测 或 者 估计 不 可 行 。 但 是 ， 如 果 
同时 综合 考虑 两 种 因素 ( 在 某 些 应 用 中 ， 费 舍 尔 称 为 “区 组 ”)， 二 者 
的 效应 可 能 超越 行 均值 或 列 均值 及 其 变异 , 因而 两 者 的 效应 清晰 可 辩 。 
即使 在 一 个 基本 的 可 加 效应 例子 中 ， 结 果 也 可 能 很 惊人 。 而 在 更 复杂 
的 情况 下 ， 结 果 可 能 带 来 史诗 级 的 震撼。 

接 下 来 ， 我 们 举 一 个 例子 ， 清 楚 展 示 可 能 错失 什么 。 考 虑 一 个 著 
名 的 数据 集 ， 它 由 拉 迪 斯 劳 斯 v5 - 鲍 特 凯 维 茨 在 19 世纪 90 年 代 提 
出 ， 鲍 特 凯 维 蒋 将 这 个 数据 集 放 在 自己 1898 年 发 行 的 简短 小 册子 《小 
数 定律 》 中 。 收 集 这 个 数据 集 耗费 了 大 量 精 力 ， 是 根据 海量 的 普鲁士 
国家 统计 编辑 而 成 的 。 数 据 给 出 14 个 骑兵 团 20 年 间 被 马 踢 死 的 骑兵 
人 数 ( 如 图 6-1 所 示 )。 鲍 特 凯 维 茨 希望 论证 ， 如 果 数 字 这 么 小 并 且 不 
可 预测 , 那么 其 中 大 的 变异 可 以 掩盖 真实 效应 。 而 且 , 根据 他 的 展示 ， 
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一 起 观察 这 280 个 数 可 以 发 现 ， 它 们 很 好 地 符合 一 组 独立 分 布 的 泊 松 
变量 的 集合 一 一 也 确实 如 此 。 但 是 ， 当 时 的 鲍 特 凯 维 茨 没 有 掌握 可 加 
模型 的 技术 。 如 果 在 此 运用 可 加 模型 ( 使 用 带 泊 松 变异 的 一 般 线性 模 
型 )， 那 么 不 仅 可 以 清晰 展示 团 与 团 的 变异 ， 还 可 展现 年 与 年 的 变异 。 
骑兵 团 和 年 份 的 变异 并 不 大 , 但 可 加 模型 允许 14+ 20 个 单独 效应 捕捉 
它们 。 利 用 240 个 单独 观测 ， 这 个 分 析 可 以 检测 这 些 效 应 。 在 埃 奇 沃 
思 的 城市 里 ， 如 果 只 看 屋顶 ， 肉 眼 即 可 看 到 山脊 和 台地 的 变异 ; 而 如 
果 沿 着 山脊 和 台地 观察 ， 则 可 看 到 房屋 的 变异 。 鲍 特 凯 维 茨 似乎 已 经 
预计 到 存在 团 和 团 的 变异 ， 但 随机 变异 掩盖 了 这 种 变异 一 一 毕竟 各 团 

























































































































































































Es ^| Al E 
规模 不 同 。 年 度 变 化 很 可 能 出 人 意料 。 
75 | 76 77|78|79 | 80 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 |89 | 90 | 91 | 92 | 93 | 94 
G|—|2|2|1 1 8 2| 1|— 1|—|1|—| 1 
I|—|—|—|e? 3|—| 2|—|—|—| 1| 1| 1|—| 2]|—| 8| 1|— 
II —|2 2 1| 1| 2| 1| 1]—|—| 2 一 | 一 
JI | 一 | 一 | 一 | 1| 1| 1| 2 2 1 1| 2| 工 | 一 | 一 | 一 
IV |—| 1|—| 1| 1| 1| 1 i -= Y: diez] es 
V | 一 | 一 | 一 | 一 | 2| 1 一 | 一 | 划一 | 一 | 1|—| 1| 1 1| 1| 1| TI 一 
VI |—|—|1|]|—. 2|—|—| 1| 2:—| 1| 1| 8| 1| 1| 1|—| 8| —|— 
VL 1|—| 1|—|—]|—| 1]—| 1| 1| —|—| 2|—|—]| 2| 1|— | 2|— 
VIII | 1 一 | 一 | 一 | 1|—|—| 1 1 —|1|1|—| 1 
I 芭 | 一 | 一 | 一 | 一 | 一 | 2| 1| 1| 1|—| 2| 1| 1 t3 1 
X|—|—C|1|1|—C| 1|—| 2|—| 2| —|]—| —| —| 2| 1| 8|—| 1| 1 
XI — 2| 4 1| 3 1| 1| 1| 1| 2| 1| 3| 1 3| 1 
XIV | 1| 1| 2| 11 £| 8|—| 4. —| 1|—| 8| 2| 1| —| 2| 1| 1|—|— 
XV 1 1|—| 1| 1|— 2| 2 一 
图 6-1 鲍 特 凯 维 茨 的 数据 收集 自 卷 轶 浩 繁 的 普鲁士 国家 统计 ( 这 
段 时 期 每 年 出 版 三 大 卷 )。 他 列 入 了 14 个 团 20 年 的 数据 








( Bortkiewicz 1898 ) 


6.2 随机 化 











KRE ' 考 克 斯 曾 这 样 描 述 统计 中 的 三 个 随机 化 规则 : “一 个 是 消除 
偏差 的 策略 ， 例 如 ， 在 不 可 观测 的 解释 变量 和 选择 效应 中 可 以 见 到 ; 
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一 个 是 估计 标准 差 的 基础 ， 最 后 一 个 是 用 于 规范 精确 的 显著 性 检验 的 
基础 。” 其 中 第 一 条 规则 受到 了 最 广泛 的 认可 , 其 至 可 以 在 主流 文化 中 
发 现 它 的 踪迹 。 漫 画 书 《功夫 大 师 》1977 年 7 月 号 中 有 这 样 的 情节 : 
大 师 根 据 思想 气球 随机 选择 了 一 张 音乐 专辑 我 从 丰富 的 专辑 中 偶然 
选择 了 一 张 。 它 毫 无 偏见 ， 令 人 耳目 一 新 ， 尽 管 无 知 是 唯一 的 救星 。” 
但 是 ， 另 两 个 原则 (它们 彼此 相关 ) 更 微妙 ， 并 且 统 计 重要 性 更 大 。 
通过 这 些 规则 ， 随 机 化 在 许多 方面 对 推断 而 言 变 得 很 基础 ， 特 别 是 在 
设计 相关 的 问题 上 ， 甚 至 在 某 些 真 正定 义 了 推断 目标 的 情况 下 。 

19 世纪 晚期 查尔斯 * S. 皮尔 斯 认识 到 这 样 一 个 事实 ， 随机 样本 
使 得 推断 变 得 可 行 。 他 甚至 对 “归纳 ”给 出 这 样 的 定义 :“ 随 机 抽样 ， 
从 一 个 样本 直到 许多 样本 ， 再 对 整 批 样本 进行 推理 。”19 世纪 80 年 代 
早期 , £988 - 霍 普 金 斯 大 学 刚刚 创立 ， 皮 尔 斯 在 这 里 研究 实验 心理 学 。 
可 以 说 ,实验 心理 学 就 是 实验 设计 创建 的 领域 。 古 斯 塔 夫 . 费 希 纳 在 
1860 年 前 后 完成 了 举重 法 对 刺激 和 感觉 影响 的 早期 研究 ， 先 定义 了 实 
验 的 方案 , 并 给 出 了 实验 目的 的 意义 。 这 个 实验 的 内 容 是 , 实验 者 (或 
助手 ) 轮流 举 起 两 个 小 容器 中 的 每 一 个 ， 每 个 容器 的 基本 重量 为 B, 
其 中 一 个 (并且 唯 一 ) 还 包含 一 个 不 同 的 重 物 D; 举 起 容器 的 人 需要 
猜测 ， 根 据 举 重 的 感觉 判断 哪个 容器 更 重 ， 即 哪 一 个 的 重量 是 B， 哪 
一 个 是 B+D? 实验 重复 数 百 甚至 上 千 次 , BH DAE, 并 且 使 用 
不 同 的 手 和 不 同 的 举重 顺序 。 有 人 把 这 种 方法 称 为 “ 正 误 法 ”。 收 集 到 
的 数据 允许 实验 者 估计 正确 猜测 的 概率 如 何 随 着 D. B 以 及 举 起 重 物 
的 手 而 变化 ， 并 使 用 现在 所 谓 的 probit 模 型 。 这 个 模型 假定 D=0 时 概 
率 为 0.5, DD 变 大 时 概率 逐渐 提高 ，D 非常 大 时 概率 渐 近 于 1。 当 时 ， 
提高 的 速度 常常 用 于 测量 与 实验 条 件 相关 的 灵敏 度 。 如 果 没 有 这 个 实 
w, 理论 就 会 空 泛 ， 或 者 至 少 无 法 量化 。 相 似 地 , 在 19 世纪 70 年 代 ， 
BRE - 艾 宾 浩 斯 进行 了 与 短期 记忆 强度 有 关 的 大 量 实验 ， 使 用 了 一 
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个 精心 制定 的 实验 计划 ， 运 用 了 无 意义 音节 。 

1884-1885 年 ， 皮 尔 斯 研究 了 一 个 更 加 微妙 的 问题 ， 对 实验 方法 
的 要 求 更 进 了 一 步 。 早 期 的 心理 学 家 曾经 猜想 ， 两 种 感觉 的 差异 有 一 
个 靖 值 ， 可 称 为 “最 小 可 党 差 ”(justnoticeable difference )。 如 果 差 异 
低 于 这 个 阔 值 ， 就 无 法 区 分 两 种 刺激 。 皮 尔 斯 与 约瑟夫 页 斯 特 罗 一 
起 设计 了 一 个 实验 ， 说 明 这 种 猜测 是 错 的 。 他 们 改进 了 举重 试验 ， 设 
计 了 一 个 新 版 本 ,其 中 两 个 重 物 相 差 质量 D 非常 小 ,这 样 一 个 重 物 只 
比 另 一 个 稍 重 一 点 。 皮 尔 斯 和 贾 斯 特 罗 表明 ， 随 着 重量 的 比例 逐渐 接 
yr 1， 正 确 判 断 的 概率 平稳 接近 L2 (但 保持 了 可 以 察觉 的 差异 )。 没 
有 迹象 表明 存在 jnd 理论 声称 的 离散 阐 值 效应 。 

很 明显 ， 这 个 实验 非常 精细 。 轻 微 的 偏差 或 提前 知道 了 重 物 展示 
的 顺序 ， 都 会 让 这 项 实验 泡汤 。 皮 尔 斯 和 贾 斯 特 罗 使 用 了 庞杂 的 防备 
措施 ， 并 做 了 记录 ， 以 确保 在 不 知情 的 情况 下 做 出 判断 。 同 时 ， 他 们 
还 引入 了 一 种 全 面 并 严格 的 随机 化 方式 一 一 使 用 一 副 完全 洗 好 的 卡片 
决定 重 物 展示 的 顺序 ( 先是 重 的 还 是 轻 的 )。 此 外 ， 整 个 研究 过 程 中 ， 
对 每 一 次 判断 的 准确 性 信心 C， 他 们 都 做 了 一 个 主观 的 记录 : C = 0 
(最 低 的 信心 )、1、2、3 (最 高 的 信心 )。 皮尔 斯 和 贾 斯 特 罗 发 现 ， 正 
确 猜测 的 概率 疡 越 大 ， 信 心 越 强 ,近似 于 log(p/(1 一 p)) 的 倍数 ， 这 个 对 
数 是 猜测 正确 胜率 的 对 数 。 他 们 还 发 现 ， 一 个 人 对 概率 的 看 法 是 对 数 
胜率 尺度 的 线性 函数 。 这 个 实验 的 有 效 性 以 及 归纳 的 结论 都 很 关键 地 
依赖 于 随机 化 。 

20 世纪 早期 ， 费 舍 尔 把 这 个 主题 推 得 更 深远 。 我 之 前 提 过 ， 他 认 
识 到 在 多 因子 设计 中 使 用 组 合 方法 进行 设计 的 优势 .1925~1930 年 的 5 
年 间 ， 费 舍 尔 扩展 了 这 个 设计 的 复杂 度 。 他 看 出 ， 在 那些 复杂 的 设置 
中 也 可 以 验证 推断 随机 化 的 行为 。 最 简单 的 情景 中 ， 在 成 对 对 象 内 ， 
随机 指派 的 处 理 和 控制 有 效 推断 了 处 理 效应 ， 而 无 需 任何 分 布 假设 
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(超越 了 对 不 同 成 对 对 象 独立 性 的 依赖 )。 随 机 分 布 本 身 诱导 出 一 个 关 
于 情况 个 数 的 二 项 分 布 ， 在 那里 的 “无 差异 ” 原 假设 下 ， 处 理 超过 控 
制 的 概率 是 1/2。 

现在 ， 回 头 思考 约翰 阿布 斯 庄 特 的 洗礼 数据 。82 年 的 数据 中 ， 
每 一 年 都 按 性 别 分 类 ( 见 第 3 章 )。 可 以 肯定 ,这 些 数据 不 会 是 设计 好 
的 实验 产物 。 把 洗礼 视 为 出 生 数 据 的 蔡 代 ， 并 假设 两 种 性 别 的 出 生 概 
率 相等 。 由 此 ， 阿 布 斯 诺 特 计算 出 ,接连 82 年 中 ,， 男 婴 出 生 的 概率 都 
超过 女 婴 的 概率 是 /2”。 用 这 个 检验 评估 出 生 频 率 可 能 会 受到 批评 : 
与 女 婴 相 比 ， 男 婴 是 否 更 不 容易 记录 在 洗礼 的 教区 记录 中 ? 而 且 即 便 
如 此 ， 两 种 性 别 的 婴儿 死亡 率 在 洗礼 之 前 一 样 吗 ? 他 的 数据 无 法 回答 
这 些 问 题 。 对 于 观察 性 的 研究 ， 如 果 没 有 其 他 选择 ， 我 们 通常 会 接受 
这 些 假设 。 但 设想 一 下 (违背 所 有 逻辑 ), 为 了 解决 “ 男 婴 和 女 婴 的 洗 
礼 无 差别 ”的 假设 ， 可 以 通过 随机 指派 出 生 时 性 别 的 方法 ， 作 为 实验 
的 一 部 分 。 于 是 ， 在 这 个 假设 下 ， 人 们 设计 的 随机 化 会 保证 在 一 年 中 
更 多 男性 受洗 的 概率 是 0.5 少 于 平局 机 会 的 一 半 )， 并 且 阿 布 斯 诺 特 
的 /2” 会 在 这 个 假设 之 下 成 为 数据 概率 的 评估 。 我 们 甚至 可 以 回想 第 
1 章 ， 意 识 到 一 个 更 好 的 检验 会 聚合 更 深 。 对 于 82 年 间 的 938 223 个 
洗礼 记录 ， 其 中 484 382 个 为 男 婴 ,标准 差 为 31.53， 高 于 性 别 概率 相 
等 的 期 待 值 ， 概 率 与 1/2” 相距 不 太 远 。 当 然 ， 阿 布 斯 诺 特 没有 使 用 
随机 化 。 而 且 对 他 来 说 ， 不 相等 的 出 生 频 率 和 不 相等 的 记录 混淆 在 一 
起 显得 毫 无 希望 。 但 如 果 有 可 能 ， 随 机 化 本 身 可 以 提供 推断 的 基准 。 

多 因素 田间 实验 中 ， 费 会 尔 的 随机 化 设计 实现 了 多 个 目标 。 完 全 
随机 化 的 行动 (例如 拉丁 方 阵 设计 中 的 随机 选择 ) 不 仅 允 许 交 互 作用 
的 分 离 和 估计 ， 还 可 能 进行 有 效 推断 ， 其 方式 不 依赖 于 正 态 假设 或 者 
材料 匀 质 性 的 假设 。 费 舍 尔 意识 到 他 的 检验 一 一 多 种 F 检验 一 一 在 原 
假设 之 下 ， 只 需要 球 对 称 就 可 以 发 挥 作用 。 正 态 性 和 独立 性 隐 含 着 球 
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对 称 ， 但 这 些 不 是 必要 条 件 。 设 计 的 随机 化 本 身 就 能 引起 离散 的 球 对 
称 特性 ， 对 看 似 要 求 更 强 条 件 的 过 程 保证 了 近似 的 有 效 性 ， 正 如 随机 
化 处 理 引起 皮尔 斯 举重 实验 中 的 二 项 变化 。 这 个 微妙 的 要 点 并 没有 受 
到 广泛 的 掌握 。 即 使 像 威廉 : 西利 : XE ( “学 生 ”) 这 样 聪明 的 统 
计 学 家 , 直到 1937 年 生命 终结 时 ,依然 坚持 “系统 化 的 田间 实验 ( EU 
如 夹层 设计 ABBABBABBA… ) 会 比 随机 试验 提供 更 好 的 估计 ”， 并 
且 认 为 两 者 都 需要 正 态 性 。 费 舍 尔 很 尊敬 戈 塞 特 , 但 在 1939 年 的 让 告 
文章 中 , 他 这 样 写 :“ 尽 管 无 疑 的 是 ( 戈 赛 特 ) 实践 了 它 , 但 他 并 不 总 
是 意识 到 随机 化 的 必要 性 ， 或 获得 系统 化 实验 的 理论 不 可 能 性 。 这 种 
实验 中 ， 真 实 误差 和 估计 误差 都 应 小 于 同一 地 块 随机 化 时 给 出 的 值 。 
这 种 特殊 的 失败 也 许 仅仅 表现 了 他 对 同事 们 的 忠诚 一 一 这 些 同事 正在 
这 方面 承受 批评 。” 
这 些 方法 的 广泛 普及 不 但 缓慢 ,而 且 通 常 只 是 部 分 性 地 受到 使 用 。 
近似 随机 化 的 模糊 形式 很 早 就 有 过 实践 。 从 大 约 公元 1100 年 开始 , 用 
于 铸币 检验 的 硬币 就 是 “随意 地 ”选择 的 ， 或 至 少 没有 故意 的 偏差 。 
1895 年 ， 挪 威 统计 学 家 安 德 斯 凯 尔 推广 了 一 种 方法 ， 他 称 之 为 “ 代 
表 性 抽样 "， 有 针对 性 地 选择 创建 样本 的 目标 。 从 不 完全 的 意义 来 说 ， 
这 个 样本 是 总 体 的 一 个 缩影 。 

1934 年 , 杰 日 . 奈 曼 为 皇家 统计 学 会 宣读 了 一 篇 有 影响 力 的 论文 
( 这 是 他 和 费 舍 尔 最 后 一 次 享有 表面 的 同事 关系 )。 奈 曼 的 论文 发 展 了 
随机 抽样 的 理论 ， 这 种 方式 严格 地 实现 凯 尔 的 目标 。 在 讨论 中 ， 费 合 
尔 赞同 论文 的 这 个 部 分 。 他 注意 到 ， 只 用 于 样本 选择 的 随机 化 在 社会 
科学 中 的 应 用 与 费 舍 尔 在 农业 中 运用 的 方法 通常 不 同 ,在 费 舍 尔 那里 ， 
不 同 的 处 理 随 机 地 强加 于 实验 单位 。“ 不 幸 的 是 , 这 个 实验 的 随机 化 过 
程 不 能 在 社会 调查 中 被 效仿 。 如 果 能 ， 那 么 人 类 事务 中 的 因果 关系 一 
定 比 已 知 的 要 多 得 多 。” 在 接 下 来 的 20 E, 社会 科学 中 的 随机 抽样 (以 
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非 扩 散 性 的 方式 ) 方法 腾飞 了 一 一 经 常 带 着 各 种 变异 ， 比 如 关注 子 总 
体 (分 层 抽样 ) 的 ， 或 作为 序列 过 程 的 一 部 分 ( 例如 “ 雪 球 抽样 ”)。 

费 舍 尔 的 随机 化 方法 极 具 扩张 性 ， 在 一 个 领域 中 取得 了 重大 进 
展 一 一 医学 或 临床 试验 。 在 那里 ， 随 机 指派 处 理 是 可 行 的 ， 就 像 皮 尔 
斯 在 举重 实验 和 费 舍 尔 在 罗 森 斯 塔 特 做 过 的 那样 。 而 且 ， 费 舍 尔 的 工 
作 吸引 了 奥 斯 丁 : 布 拉 福 德 . 希 尔 的 注意 。 通 过 希 尔 的 大 力 宣传 ， 这 
种 方法 在 那些 抗拒 改变 的 医疗 机 构 中 缓慢 但 稳步 地 推进 着 。 今 天 ， 随 
机 临床 试验 被 视 为 医学 实验 的 “黄金 标准 ”, 尽管 在 一 些 情 况 中 , 研究 
人 员 觉 得 他 们 担负 不 起 “黄金 ”。 

还 有 一 个 领域 广泛 实践 了 随机 化 设计 ,但 这 里 从 来 不 提 那 些 术 语 ， 
并 日 经 常 受 到 谴责 一 一 彩票 。 彩 票 将 随机 化 引入 社会 过 程 ， 并 对 那些 
自愿 选择 的 人 指派 了 处 理 。 对 有 些 人 来 说 ， 彩 票 是 一 种 娱乐 ; 对 另 一 
些 人 来 说 ,彩票 是 对 他 们 收取 的 “智商 税 ”。 但 彩票 的 历史 悠久 , 并 毫 
无 消失 的 迹象 。 另 外 ， 需 要 注意 ， 它 们 会 产生 一 些 科学 的 红利 。 举 一 
个 例子 就 够 了 。 

法 国 的 彩票 设立 于 1757 ^E, 它 模仿 了 早期 的 热那亚 彩票 ,很 像 今 
天 的 “ 乐 透 "。 法国 彩票 一 直到 1836 年 才 被 废除 , 之 前 只 在 1794~1797 
年 的 法 国 大 革命 恐怖 时 期 有 所 间断 。 在 正规 场合 ， 从 一 组 90 个 记 有 
1-90 的 球 当中 不 重复 地 取出 5 个 ,选择 在 本 质 上 是 随机 的 。 玩 家 可 以 
通过 指定 所 有 5 个 数字 下 注 (quine), 或 者 4 个 数字 ( quaterne )、3 个 
数字 (terne )、2 个 数字 (an ambe) 或 者 1 个 数字 (extrait ) 的 列表 。 如 
果 一 位 玩家 选择 的 数字 以 任何 顺序 、 任 何 位 置 出 现在 抽出 的 5 个 数字 
中 ， 则 为 获胜 。 有 时候 不 允许 quine 赌注 ， 因 为 存在 欺诈 风险 ( 因为 
受贿 的 代理 可 能 会 在 知道 抽出 的 数字 后 卖 出 一 张 彩票 )。 但 当 允 许 时 ， 
它 支 付 1000 000 EE 1 (一 个 公平 的 赌注 会 支付 大 约 44 000 000 EE 1 )。 
胜率 优 于 发 生 更 频繁 的 情形 ，extrait 会 支付 15 比 1 (18 EG 1 是 公平 的 )， 
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ambe 是 270 比 1，terne 是 5500 比 1，quaterne 是 75 000 IE 1. 

玩家 通常 会 一 次 投下 多 个 赌注 。 例 如 ， 对 图 6-2 所 示 的 投注 单 ， 
HET 6 个 数字 : 3、6、10、19、80 和 90，6 个 对 应 的 extraits 每 个 
下 注 25 生 丁 ，15 ambes 每 个 下 注 10 生 丁 ，20 个 teres 每 个 下 注 5 
ÆT, 15^ quaternes 每 个 下 注 5 生 丁 ，6 个 quines 每 个 下 注 5 生 丁 ， 
总 共 下 注 5 法 郎 5 生 丁 。 所 有 收益 都 安排 在 一 个 固定 的 时 间 表 内 ， 并 
且 国王 会 提供 保证 。 那 时 没有 彩 金池 保护 国王 ( 现在 有 ) 在 指定 的 日 
期 ， 真 正 抽出 来 的 数字 是 19、26、51、65 和 87。 这 张 票 只 赢 了 一 个 
单个 的 extrait ( 19 )， 付 给 25 x 15 = 375 生 丁 ， 或 者 3 法郎 75 生 丁 ， 
损失 1 法 即 30 生 丁 。 如 果 抽 出 来 的 数字 是 2、6、19、73 、80， 展 示 
的 这 张 票 会 收 到 支付 一 个 terne (6、9、80)、3 个 ambes (6 和 19、80 
以 及 19 和 80) 和 3 个 extraits， 总 收益 为 5500 x5+3x270x10+3x 
15x25 = 367 iBB 25 生 丁 。 

早 些 年 , 彩票 收入 用 于 支持 圣 西 尔 军校 。 到 1811 年 , 彩票 的 净利 
润 提供 了 多 达 4% 的 国家 预算 ， 比 邮政 或 关税 还 多 。1810 年 前 后 ， 彩 
票 达 到 销售 高 峰 , 超过 1000 家 地 方 办 事 处 发 售 彩 票 , 而 且 在 5 座 城市 
每 月 抽奖 15 次 (但 巴黎 人 可 以 对 任何 城市 的 彩票 下 注 )。 整 个 法 国 大 
革命 期 间 ， 即 使 在 路 易 十 六 和 玛丽 … 安 托 马 内 特 被 处 决 时 ， 抽 奖 依然 
没有 间断 。 仅 仅 在 慌 怖 统治 达到 其 个 高 度 后 ， 玩 家 都 丧失 得 到 偿付 的 
信心 时 ， 彩 票 才 暂 停 。 但 只 停 了 两 年 多 ， 少 量 抽奖 又 恢复 了 。 即 使 经 
过 了 拿破仑 战争 , 抽奖 也 持续 不 断 。 直 到 1836 年 基于 道德 的 考虑 , 彩 
票 才 被 禁止 。 这 是 一 场 规模 宏 大 的 、 真 正 的 随机 化 实验 。 

纵览 其 整个 历史 ， 获 胜 数字 被 广泛 公布 ， 这 就 允许 检查 抽奖 的 随 
机 性 。 彩 票 通过 了 所 有 可 用 的 检验 ， 包 括 数字 联合 发 生 的 测试 ， 其 中 
6606 种 可 用 的 抽奖 集合 可 以 允许 合理 的 检验 。 这 不 奇怪 ! 任何 明显 的 
偏差 只 会 有 利于 参与 者 而 伤害 彩票 。 
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彩票 的 一 种 社会 后 果 是 提高 了 数学 的 教育 水 平 。 为 了 评估 下 注 ， 
参与 者 学 习 组 合 分 析 ， 而 彩票 也 为 当时 的 教科 书 提供 了 许多 例子 。 彩 
票 管理 者 不 得 不 培训 大 量 本 地 操作 员 ， 以 便 这 些 销 售 代理 能 够 准确 地 
对 类 似 显 示 的 那 种 多 重 赌注 定价 。( 为 了 达到 这 个 目的 ,他 们 制作 了 特 
殊 的 文本 ， 如 图 6-2 所 示 。 ) 
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图 6-2 ”为 彩票 工作 人 员 准 备 的 说 明 手 册 ，1800 年 ， 用 于 演示 的 填 
写 好 的 彩票 样本 ， 说 明了 如 何 明 确 无 误 地 书写 数字 、 如 何 
记录 ， 还 有 如 何 对 一 张 组 合 的 彩票 定价 。 在 彩票 中 ， 消 费 
者 指定 6 个 数字 , 并 对 所 有 5 个 数字 的 子 集 投注 , 在 不 同 奖 
项 上 投注 不 同 数量 (Loterie An IX) 












































另 一 种 好 处 是 ， 彩 票 无 意 中 执行 了 可 能 是 最 早 的 科学 随机 化 社会 
调查 。 法 国 大 革命 之 后 的 时 期 ， 有 关机 构 不 仅 公布 获胜 的 数字 ， 还 公 
fi quaterne 及 其 以 上 水 平 的 所 有 获胜 的 赌注 。 这 些 记录 给 出 了 支付 的 
金额 (从 中 可 以 发 现 赌注 的 规模 )、 售 卖 彩 票 的 位 置 和 机 构 个 数 。 那些 
获胜 者 真 的 随机 选择 那些 放置 的 quaterne 赌注 ， 因 此 ， 这 个 调查 给 出 
了 一 幅 图 景 ， 刻 画 了 法 国 的 哪些 地 方 对 彩票 最 有 兴趣 ( 当然 是 巴黎 ， 
虽然 全 国 的 兴致 都 很 高 ) 以 及 彩票 的 吸引 力 如 何 随 着 时 间 变 化 。 关于 
最 后 这 个 问题 , 结果 显示 , 在 最 后 的 20 年 间 , 投注 稳步 下 降 。 这 让 人 
们 相信 ， 只 有 利润 下 降 到 低 于 维持 大 型 的 运作 所 必需 的 水 平时 ， 才 导 
致 “道德 问题 ”主导 了 政策 。 





























第 7 章 
5: 科学 逻辑 、 模 型 比较 以 及 
诊断 展示 


我 把 第 七 根 ， 即 最 后 一 根 支 柱 叫 作 残 差 ， 这 个 名 称 瞳 示 了 它 是 标 
准 数据 分 析 的 一 部 分 。 而 在 我 的 想法 里 一 一 尽管 这 并 非 完全 错误 一 一 
其 中 有 一 个 更 大 、 更 经 典 的 科学 逻辑 主题 。 

约翰 赫 软 尔 的 父亲 威廉 . 赫 吹 尔 发 现 了 天 王 星 ,约翰 追随 父亲 
的 脚步 进入 天 文学 领域 。 尽 管 父 亲 的 第 二 职业 是 音乐 ， 约 翰 却 对 数学 
和 科学 哲学 感 兴趣 ， 并 成 为 那 一 代 最 受 尊敬 的 科学 家 之 一 。 他 1831 
年 出 版 了 著作 《自然 哲学 研究 初探 》 这 本 书 得 到 广泛 阅读 并 产生 很 强 
的 影响 。 在 这 本 书 中 ,约翰 讨 论 了 科学 发 现 的 过 程 。 对 自己 所 谓 的 残 
差 过 程 ， 赫 软 尔 给 予 了 特别 强调 : 

“复杂 现象 往往 存在 几 种 相同 的 、 相 反 的 或 者 彼此 完全 独立 的 原 
因 ， 它 们 业 合 在 一 起 ,产生 了 复合 作用 。 为 了 简化 ， 可 以 排除 已 知 原 
因 的 影响 与 这 种 情况 允许 的 特点 ， 也 可 以 通过 演绎 推理 或 诉 诸 经 验 。 
留 下 的 就 是 要 解释 的 残 差 现象 。 事 实 上 ， 科 学 正 是 通过 这 样 的 过 程 受 
到 了 极 大 的 促进 ， 表 现 出 目前 的 先进 状态 。 绝 大 多 数 现象 的 类 型 极其 
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复杂 ， 而 估计 出 所 有 已 知 因素 的 精确 影响 并 排除 后 ， 残 存 的 事实 会 不 
断 呈 现 全 新 的 现象 形式 ， 进 而 导出 最 重要 的 结论 。 

从 历史 角度 说 , 赫 吹 尔 选择 了 一 个 不 幸 的 案例 : 他 把 以 太 (aether， 
后 来 称 为 luminiferous ether) 的 “发 现 ”归功 于 这 种 推理 。 当 时 的 人 
们 认为 ， 以 太 是 一 种 充满 了 外 层 空间 的 物质 ， 会 发 光 ， 并 且 对 牛顿 理 
论 中 的 一 些 异 常 现象 负责 。 我 们 仍 在 寻找 以 太 。 但 科学 原则 是 有 效 的 ， 
也 是 重要 的 : 我 们 尝试 进行 解释 ， 然 后 看 还 有 什么 需要 解释 ， 这 样 能 
够 学 习 新 知识 。 
查尔斯 达尔文 受到 了 赫 软 尔 的 著作 影响 。 据 说 ， 他 因为 受到 这 
本 书 的 鼓励 而 成 为 科学 家 。 约 验 ' 斯 图 尔 特 ' 穆 勒 1843 SEHR Y GE 
辑 学 体系 》 这 本 书 提出 了 赫 软 尔 的 思想 可 作为 实验 探究 的 4 种 方法 中 
最 重要 的 一 种 。 穆 勒 稍微 修改 了 赫 软 尔 给 出 的 名 字 ， 将 之 称 为 “ 残 差 
的 方法 ”。 穆 勒 还 写 道 ,“ 在 自然 法 则 的 所 有 研究 方法 中 ， 这 在 意外 的 
结果 中 最 富有 想象 力 。 它 常常 提醒 我 们 注意 那些 表现 突出 到 足以 吸引 
观察 者 注意 的 序列 ， 虽 然 它们 既 不 是 原因 ， 也 不 是 影响 。 

这 种 思想 大 致 上 是 古典 的 ， 但 这 种 思想 的 统计 学 发 展 进 化 出 一 种 
毁 新 而 强大 的 科学 方法 ， 进 而 改变 了 科学 实践 。 这 种 思想 的 统计 学 解 
释 和 相关 的 科学 方法 向 它 赋 予 了 一 种 新 的 纪律 性 力量 。 统 计 方法 描述 
了 这 样 一 个 过 程 : 根据 假设 模型 生成 数据 ， 继 而 通过 非 正 式 的 (例如 
通过 图 形 或 者 图 表演 示 ) 或 正式 的 统计 检验 比较 数据 和 模型 的 偏差 ， 
比较 简单 的 模型 和 复杂 的 模型 ( 比较 两 个 “ 藤 套 ”模型 ， 其 中 一 个 模 
型 是 另 一 个 的 特例 )。 

最 早 的 例子 包括 小 的 、 集 中 的 山 套 模型 ， 比 较 其 中 一 个 理论 和 男 
一 个 稍微 更 复杂 的 理论 ,一 个 最 简单 类 型 的 好 例子 是 18 世纪 的 地 球形 
状 研究 ， 我 们 曾 在 第 1 章 讨论 过 。 那 里 的 基本 ( 更 小 的 ) 模型 是 将 地 
球 看 作 一 个 球形 。 为 了 检验 这 个 模型 是 否 成 立 ， 我 们 构造 了 稍微 复杂 
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一 些 的 模型 : 把 地 球 看 作 椭 球体 一 一 一 个 在 两 极 被 压 扁 或 者 拉 长 的 球 
体 。 我 们 从 地 球 中 减 去 球体 ， 看 看 残 差 表 示 的 偏离 ， 以 及 如 果 残 差 存 
在 ， 方 向 会 向 着 哪里 。 但 是 需要 怎么 做 呢 ? 对 这 样 一 种 检验 应 该 运用 
什么 样 的 地 球 测 量 ? 18 世纪 采用 的 途径 是 沿 着 一 条 子午 线 测量 一 系 
列 的 短 弧 长 。 如 果 4 是 纬度 世上 的 1 弧度 的 长 度 , 那么 假设 地 球 是 一 
个 球体 , 4 应 该 在 所 有 纬度 上 都 相同 , 即 4 = z 。 但 如 果 地 球 是 一 个 椭 
球体 ， 那 么 为 了 获得 良好 的 近似 ， 应 该 使 用 4=z+ysin Lo WR 
球 在 两 极 是 扁 的 或 长 的 ， 可 以 得 到 y > 0 或 者 y < 0。 所 以 ， 给 定 不 同 
纬度 的 弧度 测量 集合 后 , 问题 就 成 了 : WR sin? Lm, 拟 合 y=0( 即 
4=z) 产生 的 拟 合 残 差 是 向 上 偏 还 是 向 下 偏 ， 或 者 两 者 都 不 是 ?更 靠 
近 极 点 的 弧度 相 比 于 那些 靠近 赤道 的 弧度 是 更 短 还 是 更 长 ? 

图 7-1 展示 了 罗 杰 : 约瑟夫 ' 博 斯 科 维 奇 自己 的 图 ， 记 为 XY 的 
线 表示 球体 ( 4= z , 其 中 z 是 数据 的 平均 弧 长 ), 5 个 数据 点 a、b、c、 
4 和 e 表 示 XY AIRA. KERE AF, Ah sin? LIA - 08] L — 188 
值 , 垂直 轴 是 AX, 给 出 弧 长 4 的 值 。 R GF 是 博 斯 科 维 奇 通过 自己 的 
算法 计算 的 ， 即 这 条 线 穿 过 5 个 点 的 重心 G， 同 时 最 小 化 了 它们 与 这 
条 线 的 绝对 垂直 离 差 之 和 。XY 的 残 差 计算 出 斜率 为 正 ， 这 意味 着 地 
球 是 扁 的 。 

这 是 区 套 成 对 模型 的 可 能 例子 中 最 简单 的 情况 ，4=z 是 
4=z+ysin" 工 的 特例 。 这 是 最 早 对 一 个 回归 方程 与 男 一 个 加 入 新 的 
“预测 变量 ” sin” 工 一 一 的 回归 方程 进行 比较 的 例子 。 尽管 博 斯 科 
维 奇 并 未 提 及 概率 ( 而 且 因 此 也 没有 给 出 属于 y 估计 的 不 确定 性 的 估 
计 ), 但 从 那 以 后 , 他 使 用 的 基本 方法 已 经 成 为 模型 适当 性 的 统计 解释 
的 主流 方法 。 
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图 7-1 博 斯 科 维 奇 自己 的 图 , 来 自 1770 年 的 一 份 出 版 物 ， 展 示 了 
表示 球体 的 线 XY, MERK a, b, c, dF ehy 5A XY HS 
残 差 点 。 博 斯 科 维 奇 通过 自己 的 算法 发 现 的 线 是 GV, 是 XY 
残 差 计算 的 斜率 (Maire 与 Boscovich 1770 ) 


















































自然 地 ， 这 些 租 套 模 型 出 现在 物理 科学 中 。 一 个 简单 的 模型 越 来 
越 复 杂 ， 并 通过 局 部 到 近 进行 线性 化 时 ， 往 往 需 要 在 方程 中 添加 一 个 
或 者 多 个 项 。 根 据 方程 的 不 同 点 取 测量 ， 会 受到 实验 误差 的 影响 。 但 
1805 年 后 ,不断 发 展 的 最 小 二 乘 技术 使 计算 更 简单 。18 世纪 ， 莱 昂 哈 
德 . 欧 拉 、 约 瑟 夫 : 路 易 : 拉 格 朗 日 以 及 皮 埃 尔 : 西蒙 : 拉 普 拉 斯 
尝试 不 同 的 方式 ,试图 在 行星 运动 的 两 体 牛 顿 模型 中 引入 三 体 引 力 时 ， 
需要 面 对 新 的 问题 : 增加 的 项 可 不 可 以 是 0? 他 们 的 研究 基于 观察 到 
的 残 差 效应 而 展开 。 随 着 人 们 更 好 地 确定 了 木星 和 土星 的 轨道 ， 以 及 
很 长 一 段 时 间 内 更 仔细 地 检查 数据 ， 似 乎 可 以 认为 ， 过 去 几 个 世纪 以 
来 ， 木 星 一 直 在 加 速 ， 而 土星 在 减速 。 如 果 这 些 巨 大 星体 的 轨道 不 稳 
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定 ， 那 对 太阳 系 来 说 不 是 个 好 兆头 。 尽 管 这 种 针对 行星 速度 改变 的 怀 
疑 只 是 三 体 引力 产生 的 结果 一 一 太阳 、 木 星 和 土星 。 欧 拉 和 拉 格 朗 日 
都 对 这 个 研究 做 出 了 重要 推进 ， 但 最 终 完成 的 是 拉 普 拉 斯 。 他 找到 了 
扩展 运动 方程 的 一 种 新 方法 : 先 在 方程 中 引入 更 高 阶 的 项 ， 再 检验 明 
显 的 运动 是 否 与 这 些 高 阶 项 的 影响 一 致 。 拉 普 拉 斯 成 功 揭示 了 观察 到 
的 改变 速度 只 是 星体 运动 周期 改变 的 一 部 分 , 周期 长 度 大 致 为 900 年 ， 
原因 是 这 两 个 行星 平均 运动 的 比率 接近 5 : 2。 残 差分 析 挽 救 了 太阳 系 。 
这 些 研究 后 来 成 为 其 他 人 学 习 的 模范 案例 。19 世纪 20 年 代 ， 人 
们 会 通过 检验 显著 性 进行 比较 ， 或 者 至 少 比较 未 知 差异 和 额外 系数 的 
可 能 误差 (或 p.e. ) 的 估计 。 拉 普 拉 斯 在 1825-1827 年 关于 大 气 层 太 
明湖 的 研究 就 属于 这 种 类 型 的 比较 ( 见 第 3 章 ), 但 这 种 方法 未 能 给 出 
一 种 容易 的 实施 路 径 ， 用 以 比较 无 碟 套 的 模型 ， 哪 个 模型 都 没有 只 比 
其 他 模型 相差 一 个 残 差 。 另 外 ,本质 更 复杂 的 哲学 问题 并 没有 普 适 的 
方法 ， 而 模型 的 陈述 中 也 不 易 得 到 “更 简单 ”的 含义 。 

从 20 世纪 初 开始 , 物理 科学 的 线性 方程 开始 用 于 社会 科学 , 并 且 
很 自然 地 遵循 着 同样 的 路 线 。 先 指定 一 组 “解释 ”变量 ， 再 多 增加 一 
些 线性 变量 ， 最 后 考查 它们 是 否 导致 显著 性 差异 ， 或 这 些 项 是 否 在 统 
计 上 与 0 无 差异 。 乔 治 . 尤 尔 1899 年 对 “济贫 法 ”( 英国 福利 系统 的 
一 部 分 ) 进行 了 检查 , 这 是 最 早 使 用 该 方法 进行 深入 研究 的 实例 之 一 。 
一 次 调查 中 ， 他 考查 了 贫困 水 平 与 福利 救济 金额 之 间 的 关系 ， 增 加 福 
利 救济 会 导致 贫困 水 平 上 升 还 是 下 降 ? 尤 尔 比 较 了 1871 年 和 1881 年 
的 数据 ， 根 据 一 个 市 辖区 10 年 来 的 “贫困 ”( 贫困 水 平 ) 变化 ， 探 寻 
和 确定 这 个 地 区 接受 的 “贫民 救济 ”( 福利 ) 变化 的 比例 效应 ( 如 图 
7-2 所 示 )。 这 个 简单 回归 的 样本 的 地 区 不 同 ， 数 据点 也 不 同 ， 尤 尔 还 
知道 ， 其 他 经 济 因素 也 在 变化 。 因 此 ， 他 把 这 个 问题 重 定义 为 与 残 差 
现象 有 关 的 新 间 题 。 先 根据 其 他 经 济 因素 校正 所 有 数据 , 再 研究 关系 。 
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系 的 困难 一 直 是 个 麻烦 〈 而 且 尤 尔 很 仔细 地 注意 到 了 这 一 
这 仍然 标志 着 社会 科学 研究 开启 了 一 个 新 时 代 。 使 用 这 种 方法 会 面临 


诸多 困难 ， 比 如 ， 线 性 方程 对 于 问题 是 








开放 的 (尽管 尤 尔 ; 


致 的 分 析 ， 他 发 现 这 两 个 变量 之 间 的 一 个 正 相 关 关 系 。 
从 那 时 到 现在 ， 解 释 这 个 结果 的 问题 以 及 从 相关 关系 推 新 因果 关 

















点 Ja 但 是 ， 


注意 到 ,无 


论 关 系 多 么 复杂 ， 他 都 估计 了 最 接近 的 线性 近似 方程 ); 再 比如 ,“ 解 
释 ” 变 量 之 间 的 关系 可 能 严重 模糊 问题 的 解释 。 如 果 小 心 使 用 ， 它 会 
展示 出 技术 解释 的 强大 。 不 过 ， 如 果 没 有 出 现 一 项 重要 进展 ， 该 技术 


似乎 难 逃 束缚 于 线性 最 小 二 乘 的 命运 。 这 项 重要 进展 就 是 参数 化 模型 
的 引入 。 
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used. Then suppose a characteristic or regression equation to 
be formed from these data, in the way described in my previous 
paper, first between the changes in pauperism and changes in 
proportion of out-relief only. This equation would be of the 
form— 

change in pauperism 

—A-Bx (change in proportion of out-relief) } 7 

where A and B are constants (numbers) (1) 

This equation would suffer from the disadvantage of the 
possibility of a double interpretation, as mentioned above: the 
association of the changes of pauperism with changes in pro- 
portion of out-relief might be ascribed either to a direct action of 
the latter on the former, or to a common association of both with 
economic and social changes. But now let all the other variables 
tabulated be brought into the equation, it will then be of the 
form— 
change in pauperism — 
a+b x (change in proportion of out-relief) 

十 cx (change in age distribution) lo 

十 ZX 

Tex aa in other economic, social, and moral factors 
+fx 

Any double interpretation is now—very largely at all events— 
excluded. Tt cannot be argued that the changes in pauperism 
and out-relief are both due to the changes in age distribution, for 
that has been separately allowed for in the third term on the right; 
bx (change in proportion of out-relief) gives the change due to 
this factor when all the others are kept constant. There is still a 
certain chance of error depending ou the number of factors 
correlated both with pauperism and with proportion of out-relief 
which have been omitted, but obviously this chance of error will 
be much smaller than before. 














图 7-2 尤 尔 描述 贫困 变动 的 多 元 回归 方程 (Yule 1899 ) 
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明确 使 用 参数 模型 是 罗 纳 德 .A. 费 舍 尔 的 一 项 精妙 创新 ， 这 项 创 
新 很 容易 受到 忽视 ， 因 为 他 自己 都 不 认为 需要 注意 这 一 点 。 但 费 舍 尔 
1922 年 发 表 了 一 篇 基础 性 论文 ， 介 绍 了 一 种 新 的 理论 数理 统计 。“ 参 
数 ” 这 个 词 看 似 无 处 不 在 ,但 在 费 合 尔 或 更 早 其 他 人 的 统计 工作 中 ， 
它 几 乎 是 缺席 的 。 费 舍 尔 通过 分 布 族 f(x,9) 一 一 可 能 的 多 维 参 数 9 的 
光滑 函数 一 一 替换 了 卡尔 皮尔 逊 的 总 体 分 布 /(x) ， 这 个 分 布 非常 一 
般 ， 并 未 特别 指定 。 由 此 ， 费 舍 尔 对 他 研究 的 估计 或 检验 问题 施加 了 
约束 和 结构 ， 支 持 了 之 前 不 可 能 的 数学 分 析 。 回 首 过 往 ， 我 们 可 以 把 
线性 模型 的 早期 最 小 二 乘 视 为 参数 模型 的 特例 ， 而 费 舍 尔 进 行 了 非常 
一 般 化 的 扩展 ， 并 且 控 掘 了 出 乎 意料 的 理论 成 果 。 

杰 日 . 奈 曼 和 卡尔 : 皮尔 逊 的 儿子 爱 由 SS. EKHE 1928~1933 
年 发 表 的 文章 中 ,采用 了 费 舍 尔 的 创新 ， 并 把 它 与 假设 检验 的 方法 相 
结合 。 从 一 开始 ， 设 计 假 设 检验 就 是 为 了 检验 模型 。 其 最 强 的 结果 就 
是 奈 曼 -皮尔 逊 引 理 , 它 甚至 解答 了 如 何 比较 两 个 非 幅 套 模型 一 一 尽管 
只 能 在 它们 完全 指定 的 情况 下 。 这 里 没有 参数 需要 估计 ， 只 有 一 个 直 
接 的 问题 数据 来 自 抽样 分 布 A 还 是 抽样 分 布 B? 更 一 般 的 情形 是 
义 似 然 比 检验 ， 其 中 检验 是 明确 的 残 差 类 型 。 这 个 检验 可 以 视 为 一 种 
竞争 : 一 个 参数 化 的 分 布 族 对 抗 一 个 更 广泛 的 分 布 族 , 后 者 包括 前 者 。 
当然 , 分布 族 更 大 缘 于 它 的 灵活 性 更 大 , 拟 合 的 结果 会 更 接近 。 但 是 ， 
这 种 额外 的 灵活 性 提高 足以 证 明 它 的 使 用 合理 吗 ? 尤 其 是 ， 这 种 提高 
会 大 于 单个 机 遇 给 我 们 的 期 待 吗 ? 

举 个 简单 例子 ， 可 以 考虑 卡尔 ， 皮尔 逊 1900 年 研究 过 的 一 个 问 
题 。 为 了 更 好 地 理解 概率 ， 弗 兰 克 “，' 韦 尔 登 付 出 了 非凡 的 努力 。 他 设 
计 了 一 个 骨 子 投掷 实验 ， 每 次 投掷 12 个 骨 子 ， 同 时 记录 每 组 124-8 
子 中 有 多 少 仍 子 显示 5 或 者 6。 这 个 实验 总 共 重 复 了 26 306K, RF 
投掷 的 总 个 数 为 12 x 26 306 = 315 672。 皮 尔 逊 的 表格 在 “观测 频率 ” 
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( Observed Frequency ) 这 一 列 给 出 了 结果 。 

为 了 使 你 了 解 这 其 中 包含 的 劳动 ， 我 可 以 告诉 你 几 年 前 我 课 上 的 
一 位 学 生 扎 克 … 拉 比 对 这 个 实验 的 重复 。 他 发 明了 一 种 机 械 方法 做 这 
个 实验 : 先 摇动 一 个 有 12 个 普通 散 子 的 盒子 , TAF, 计算 机 随即 
拍 下 结果 照片 机 并 进行 处 理 ， 人 然后 整理 数据 。 一 次 实验 大 约 需 要 20 
秒 。 机 器 日 夜 运转 ， 大 约 花费 了 一 周 的 时 间 ， 运 行 了 26 306 K. WR 
一 下 ,一 个 人 何以 亲手 完成 这 一 切 。 韦 尔 登 在 一 个 报告 中 表示 过 ， 他 
的 妻子 帮助 了 他 。 人 们 有 些 好 奇 这 桩 婚姻 面临 的 压力 。 

圳 尔 登 实验 的 重点 是 想 考 查 真实 世界 与 理论 世界 的 接近 程度 。 
次 试验 有 13 种 可 能 结果 : 0、1、…、12。 如 果 援 子 完全 公平 ， 同 时 每 
次 投掷 完全 独立 , 那么 理论 会 认为 ,每 次 投掷 12 个 货 子 的 试验 中 ,出 
现 5 或 者 6 的 概率 是 13。 所 以 12 RETARA cH 5 或 者 6 的 概 




































































12 k 12-k 
kh NE Prob(4*5 or6" =k} = | IB k ) 。“ 理 论 频率 ” 


这 一 列 ， 就 是 这 一 系列 的 每 个 值 乘 以 26 306 的 结果 。 

1900 年 之 前 (甚至 在 1900 年 中 )， 这 个 超级 难题 很 不 容易 得 到 正 
确 处 理 。 数 据点 位 于 13 维 空间 (图 7-3 PERA m )， 当 时 的 统计 
世界 并 不 熟悉 这 样 的 结构 。 聚 集 26 306 次 实验 的 集合 距离 理论 点 这 么 
远 (EIKE m), 那么 应 该 放弃 二 项 模型 吗 ?而且 ,如 果 放 弃 这 个 假 
设 ， 那 么 替代 假设 是 什么 ”那个 时 代 更 加 杰出 的 分 析 者 〈 例如 弗 朗 西 
斯 ， 埃 奇 沃 思 和 皮尔 逊 ) 认为 ， 单 独 考察 一 个 维度 一 一 13 个 维度 中 的 
每 个 维度 ( 表 中 的 13 行 ) 一 一 是 不 正确 的 方式 。 但 是 , 然后 该 做 什么 
呢 ? 皮 尔 逊 通过 卡 方 检验 的 离 差 解决 这 个 问题 ,这 种 方法 在 1900 年 的 
统计 学 发 展 中 是 相当 具有 变革 性 的 一 步 ,统计 学 上 第 一 次 出 现 同 时 进行 
多 个 检验 的 方法 一 一 将 13 个 维度 纳入 一 个 检验 。 它 不 仅 考虑 了 “13 个 
问题 都 包括 ”的 事实 , 还 考虑 了 13 个 维度 之 间 明 显 的 不 独立 关系 。 如 














































































































第 7 章 残 差 ， 科学 逻辑 、 模 型 比较 以 及 诊断 展示 | 117 





果 点 集 远 离 一 个 维度 的 理论 ， 那 么 它 也 会 远离 其 他 维度 的 理论 。 如 果 
根本 没有 出 现 5 或 6， 那么 其 他 一 些 结果 必然 会 频频 发 生 。 卡 方 检验 
通过 一 个 简单 的 模型 做 检验 ,只 需要 这 26 306 个 试验 相互 独立 , 就 可 以 
用 于 其 他 广泛 的 解释 ， 包 括 其 他 可 能 的 所 有 二 元 分 布 以 及 非 二 元 分 布 。 
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No. of Dice in | 





























E g f Observed Theoretical US 
Dee n ps Frequency, m’. Frequency, m. Deviation, e, 
| 185 203 — 18 
| 1149 1217 — 68 
| 3265 3345 — 80 
| 5475 5576 —101 
| 6114 6273 —159 
| 5194 5018 +176 
| 3067 | 2927 +140 
| 1331 1254 #77 
| 403 392 4a 
| 105 87 + 18 
| 14 13 + 1 
| 4 1 +3 
| 0 0 0 
26306 26306 
图 7-3 韦 尔 登 的 角子 数 据 ， 由 皮尔 逊 给 出 (Pearson 1900 ) 








皮尔 逊 的 检验 发 现 , 数据 与 简单 模型 并 不 一 致 , 有 些 东 西 不 对 劲 。 
而 且 数 据 表明 ,“5 或 6” 发 生 的 频率 相 比 于 每 3 个 骨 子 掷 一 次 的 情况 
更 高 。 数 据 本 身 给 出 的 5 或 6 的 比例 函数 为 106 602/315 672 = 0.3377, 
KAKF 1/3 。 接 下 来 ,皮尔 逊 尝试 检验 了 一 般 的 二 项 假设 ， 其 中 


Prob{# “5 or 6” =k} = Wu 0-0)? -*, 但 未 坚持 9=1/3 ， 而 使 用 





了 69=0.3377 计算 理论 值 ， 提 升 了 拟 合 度 ( 如 图 7-4 所 示 )。 

EKE, 数据 对 新 计算 的 列 m' 进行 了 卡 方 检验 。 费 舍 尔 根据 自己 
对 参数 模型 提出 的 新 概念 ， 在 20 世纪 20 年 代 早 期 表示 ， 皮 尔 逊 在 这 
里 犯 了 错误 。 他 没有 对 事实 做 出 考虑 ， 而 实际 上 让 数据 选择 了 理论 。 
但 这 种 情况 下 的 这 种 错误 并 不 严重 ， 并 且 ， 皮 和 尔 逊 的 结论 受到 了 费 含 
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尔 对 损失 “自由 度 ” 的 修正 。 















































| qm. e. em. 
187 | ‘— 2 -021,3904 
1146 | + 8 -007,8534 | 
| 3215 | +50 “777,6050 | 
5465 十 10 01892983 | 
6260 | | —155 3:991,8645 | 
5115 十 79 1.220,1342 
3043 HA -189,2869 
1830 n En -000,7519 
424 x91 1:040,0948 
96 + 9 -841,8094 
| 15 SET “666,6667 
| H as 19 
| 0 0 0 | 
| | 
由 wa e cei f | 
图 7-4 BRAT AE , KEME 0 20.3377 重新 计算 了 m 理 




















论 值 (Pearson 1900 ) 
































皮尔 逊 猜 测 ，2 = 0.3377 更 大 的 理由 是 ， 骨 子 的 每 一 个 点 是 通过 
在 相应 位 置 上 挖 去 少量 材料 形成 的 ， 那 时 如 此 ， 以 后 亦 是 如 此 。 于 是 
点 数 5 和 6 的 面 是 6 个 面 中 最 轻 的 ， 哪 怕 数 量 差 得 极其 微小 。 这 种 猜 
想 一 直 戌 行 于 接 下 来 的 这 个 世纪 ， 似 乎 说 服 了 所 有 听 过 的 人 。 但 当 拉 
比 以 同样 种 类 的 山子 重复 这 个 实验 时 ， 一些 惊 人 的 事情 发 生 了 。 通 过 
计算 机 的 计数 处 理 ， 他 可 以 得 到 每 个 角子 的 6 种 可 能 结果 中 的 每 一 个 
的 计数 ; 而 不 像 韦 尔 登 和 他 的 妻子 ， 只 注意 “5 或 6” 或 者 “不 是 5 
或 6"。 拉 比 发 现 (就 像 皮尔 逊 )， 结 果 并 不 符合 简单 的 假设 。 他 发 现 
RTRÆ "526" WEHE 0.3343 ， 而 且 最 频繁 出 现 的 面 确实 是 6。 
但 另 一 个 意外 出 现 了 :第 二 频繁 出 现 的 面 是 1。 这 就 引发 了 另 一 种 解释 : 
6 和 1 在 每 个 山子 上 都 是 相对 的 两 面 。 或 许 货 子 不 是 正 立方 体 , 或 许 这 
两 面 比 其 他 相对 的 面 更 接近 。 或 许 仍 子 就 像 厚 厚 的 方块 硬币 , 1 和 6 是 
硬币 的 正 反面 ， 其 他 的 面 都 是 硬币 的 边缘 。 当 拉 比 用 游标 卡尺 测量 仍 
子 时 , 结果 非常 支持 这 个 猜想 。 他 的 仍 子 上 , 1-6 这 条 轴 短 了 大 约 0.2%。 
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皮尔 撑 的 检验 为 残 差 方 法 的 实践 打开 了 新 的 统计 前 景 。 经 过 费 舍 
尔 对 自由 度 问题 的 修正 ， 以 及 复杂 参数 模型 的 多 种 扩展 ， 现 在 可 以 在 


一 个 检验 中 对 更 复杂 的 综合 怕 








20 世纪 70 年 代 , 统计 学 引入 


E 备 选 假设 ,并 检验 一 些 相当 复杂 的 假设 。 
了 广义 线性 模型 ， 它 吸收 了 似 然 的 思想 ， 








以 一 种 非常 灵活 的 方式 扩展 至 多 种 形式 的 参数 化 计数 数据 ， 以 及 标准 
的 线性 模型 和 方差 分 析 ， 甚 至 跨 平 台 的 谍 套 模型 的 内 部 检验 使 用 。 











扩展 并 不 局 限于 参数 方程 。 大 卫 “' 考 克 斯 洞察 到 ， 我 讨论 的 残 差 











仿 验 必需 的 全 部 要 素 只 是 附加 部 分 的 参数 化 ， 而 基本 模型 可 以 是 非 参 
数 的 。 换 名 话说 ， 比 较 一 个 复杂 模型 和 一 个 简单 模型 时 ， 当 后 者 是 前 





























者 的 特例 ， 那 么 “简单 模型 ” 


可 以 并 不 简单 ， 甚 至 可 以 相当 复杂 ， 也 




















甚至 可 以 并 不 明确 。 附 加 部 分 是 真正 需要 参数 化 的 ， 其 目的 是 允许 使 





法 有 时 称 为 “部 分 似 然 方 法 ”， 

















用 强大 的 参数 方法 ， 以 对 解释 能 力 的 增益 做 出 严格 检验 。 考 克 斯 的 方 








经 过 生存 数据 分 析 以 及 医学 的 其 他 应 用 





对 考 克 斯 回归 的 使 用 ， 它 已 经 产生 了 巨大 影响 。 





诊断 和 其 他 图 形 








“ 残 差 分 析 ” 是 统计 学 最 
38") 中 。 先 拟 合 回归 方程 ， 
合 值 ), 进而 对 拟 合 进行 评价 ， 














常见 的 术语 ， 出 现在 模型 诊断 Cim tige 
再 画 出 “ 残 差 ”( = 观测 的 因 变 量 减 去 拟 
以 及 看 看 是 否 存 在 模式 有 可 能 提示 下 一 














阶段 的 建 模 ， 这 种 做 法 在 统计 学 家 中 已 经 很 常见 。 例 如 ， 图 7-5 展示 
了 两 张 残 差 图 ， 第 一 张 图 对 应 回归 5S= a + bA + cE, 来自 加 拉 帕 戈 斯 
群岛 的 n= 23 的 一 组 数据 ， 记 录 了 特有 物种 个 数 S、 面 积 4， 以 及 每 























个 岛 最 高 点 海拔 已 ， 目 标 是 了 解 4 和 如 何 影 响 物种 多 样 性 S。 这 个 




















拟 合 模型 产生 23 个 残 差 , 是 8-$ 的 差 ， 其 中 每 一 个 ?是 w、2D 、c 为 最 
小 二 乘 估计 时 的 岛屿 值 a+b4+cE 。S-$ 对 $ 的 图 表明 ，$ 更 大 ， 变 
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异 的 关系 也 会 随 之 增强 。 它 建议 ， 对 变量 进行 对 数 转换 ， 这 引出 了 更 
合理 的 模型 ，logS =a+blog 4+clog EE ， 这 个 模型 的 残 差 如 图 7-5 下 
图 所 示 。 第 二 个 模型 描述 了 一 种 乘 数 关系 ，S x APE* 。 这 个 分 析 的 一 
个 结果 是 使 我 们 认识 到 ， 虽 然 科 隆 群 岛 也 许 是 达尔 文 进行 探索 的 最 佳 
地 点 ， 但 对 于 分 离 面 积 和 海拔 对 物种 多 样 性 的 各 自 影 响 而 言 ， 它 们 不 
大 合适 。 这些 岛屿 大 体 由 火山 岩 构 成 , 而 巨大 致 与 4 的 平方 根 成 比例 。 
而 且 ， 在 实践 中 ，log 4 fI log E 这 两 个 对 数 尺度 的 变量 近似 于 线性 关 
系 。 为 了 分 离 这 种 效应 ， 我 们 还 需要 其 他 数据 。 
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图 7-5 加 拉 帕 戈 斯 数据 的 残 差 图 ，( 上 图 ) 原始 尺度 与 (下 图 ) 变 
换 为 对 数 尺度 
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统计 图 形 历 史 修 入。 人 们 在 18 世纪 初 就 已 发 现 很 多 有 趣 的 应 用 ， 
但 到 20 世纪 , 它们 才 真 正 繁荣 起 来 。 并 且 , 在 计算 机 时 代 , 它们 的 使 
用 产生 了 爆炸 式 发 展 ， 甚 至 偶尔 会 出 现 1000 张 图 只 值 一 个 字 的 情况 。 
如 果 我 们 先 不 考虑 那些 只 用 作 装 饰 的 图 形 〈 这 占 了 它们 今天 应 用 的 一 
个 显著 比例 ), 那么 简单 地 说 ,其 余 所 有 图 形 要 么 是 修饰 工具 , 要 么 是 
诊断 与 发 现 的 工具 。 残 差 图 的 类 型 可 以 归 人 后 者 ， 但 事实 上 ， 所 有 诊 
断 图 都 使 用 了 残 差 的 扩展 定义 一 一 都 是 某 种 程度 的 残 差 图 。 比 如 ， 饼 
图 通过 图 形 对 圆 的 等 分 基线 的 偏离 , 显示 各 部 分 不 相等 的 程度 。 这 时 ， 
本 身 低 水 平 的 饼 图 也 显现 出 超越 修饰 的 价值 ( 如 图 7-6 所 示 )。 
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图 7-6 第 一 张 饼 图 (Playfair 1801 ) 




















1852F, AIE 法 尔 发 表 了 一 个 类 型 不 同 的 环形 图 ， 这 幅 图 是 对 


1848-1849 FË 





LE 虚 英格兰 的 霍乱 所 做 的 部 分 研究 。 他 希望 发 现 埠 而 





播 的 机 制 ， 对 每 年 的 数据 绕 着 圆圈 画 出 几 个 变量 。 图 7-7 显示 了 1 
年 的 数据 。( 原始 图 是 彩色 印刷 的 。) 外 圆 显示 死亡 率 ， 这 个 圆 表示 没 
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有 瘟疫 流行 时 ， 平 均 年 死亡 率 的 周 基 线 一 一 将 每 周 的 死亡 总 人 数 标记 
为 这 一 周到 中 心 的 距离 。 从 图 上 可 以 看 到 ，1849 年 7-9 月 ， 死 亡 人 数 
相当 多 。5 月 和 11 月 的 死亡 率 低 于 平均 值 ， 用 更 浅 的 阴影 显示 ， 位 于 
外 圆 之 内 。1849 4E 7-9 月 的 瘟疫 大 流行 似乎 跳 离 了 页 面 。 法 尔 怀疑 ， 

空气 传播 是 致 病原 因 ， 但 这 些 图 并 不 能 提供 答案 。 直 到 后 来 根据 非 几 
形 的 理由 ， 他 才 相信 水 是 这 种 疾病 的 传播 方式 。 内 圆 作为 基线 显示 了 
平均 周 气 温 , 这 个 圆 本 身 提供 了 年 度 平均 , 6~9 月 更 高 的 气温 用 轻微 的 
铅 灰色 追踪 了 霍乱 流行 。 总 之 ， 疾 病 和 气候 之 间 有 着 明显 的 关系 ， 这 
个 图 形 的 两 个 部 分 显示 了 残 差 现象 。 
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7-7 法 尔 的 1849 年 霍乱 疫情 的 环形 图 (Farr 1852 ) 

















法 尔 的 图 还 有 另 一 个 重要 结果 。 弗 洛 伦 斯 南 丁 格 尔 采 用 了 法 尔 
的 思想 ， 并 应 用 于 她 对 英国 野战 医院 卫生 措施 进行 的 改革 中 ， 由 此 产 
生 了 巨大 的 修饰 效果 ( 如 图 7-8 所 示 )。 
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DIAGRAM REPRESENTING THE MORTALITY IN THE HOSPTTATS. 
AT SCUTARI AND KULALL FROM OCT® IST 1854. TO SEPT? 307" 1855. 




















图 7-8 南 丁 格 尔 的 示意 图 显示 了 克 里 米 亚 战争 中 野战 医院 的 死亡 
人 数 (Nightingale 1859 ) 


























克 里 米 亚 战 争 期 间 ， 南 丁 格 尔 服 务 于 斯 库 塔 兵 营 (位 于 土耳其 ， 
靠近 克 里 米 亚 ) 的 陆军 医院 。 她 得 知 ， 高 死亡 率 并 非 由 于 在 战斗 中 受 
伤 ， 而 是 霍乱 这 样 的 疾病 以 及 卫生 政策 的 漏洞 造成 的 。 相 比 之 下 ， 英 
国 的 军队 医院 更 有 能 力 处 理 这 样 的 问题 ， 并 有 更 好 的 记录 。 她 返回 英 
HZ, 决心 为 野战 医院 争取 更 高 的 标准 。 南 丁 格 尔 采 用 了 法 尔 图 形 的 
形式 ， 用 大 的 棉 形 显示 了 斯 库 塔 和 库 拉 里 的 死亡 率 ， 用 虚线 环形 表示 
位 于 伦敦 及 其 附近 的 军队 医院 的 平均 死亡 率 基 线 ， 对 两 者 做 对 比 ， 基 
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线 比 棉 形 小 得 惊人 。 南 丁 格 尔 只 对 法 尔 的 图 形 做 了 一 处 改动 ， 使 它 产 
生 更 震惊 的 效果 。 对 于 死亡 数字 ， 法 尔 用 中 心 距离 表示 ， 而 南 丁 格 尔 
用 棉 形 面积 表示 。 换 句 话 说 ， 她 把 死亡 人 数 的 平方 根 画 成 中 心 距离 。 
(在 当时 , 构建 这 样 的 图 形 需要 大 量 劳动 。 后 来 , 我 根据 数据 重新 计算 
了 图 形 的 高 度 ， 发 现 她 确实 是 照 自 己 所 说 的 方式 去 做 的 。) 

法 尔 的 图 会 给 人 欺骗 性 的 印象 。 在 他 的 系统 中 , 如 果 死 亡 率 加 售 ， 
面积 会 增 大 到 原来 的 4 倍 ， 视 觉 效 果 更 夸张 。 南 丁 格 尔 确实 避免 了 这 
一 点 ， 给 出 了 一 张 没 有 误导 性 的 图 像 。 矛 盾 的 是 ， 法 尔 心 怀 探索 的 大 
望 去 绘图 ， 却 产生 了 误导 性 的 图 像 ; 而 南 丁 格 尔 为 了 修饰 来 绘图 ， 却 
并 未 产生 误导 。 两 者 都 强调 了 平均 值 的 残 差 。 
















































































这 七 根 支 柱 是 统计 智慧 的 主要 支撑 ， 而 它们 自身 并 不 构成 智慧 。 
七 根 文 柱 可 以 至 少 追 溯 到 20 世纪 上 半 叶 , 其 中 有 些 还 会 更 古老 。 经 过 
长 期 使 用 , 它们 已 经 证 明了 自己 , 但 还 需 根据 新 的 需要 适应 新 的 应 用 。 
它们 是 统计 科学 的 基础 ， 也 是 最 早 的 、 卓 越 的 数据 科学 。 这 七 根 支 柱 
可 以 视 为 统计 这 门 科 学 的 一 个 智力 分 类 系统 ， 它 们 可 以 很 好 地 与 其 他 
言 息 科 学 合作 ， 比 如 计算 机 科学 ， 以 及 其 他 有 着 新 名 字 但 尚未 获得 完 
整 身份 的 新 学 科 。 但 是 ， 这 些 支 柱 的 思想 依然 相当 激进 ， 一 旦 误 用 会 
相当 和 危险， 而 且 阁 人 陌生 领域 时 会 引发 对 抗 性 反应 。 它 们 当中 没有 哪 
个 已 经 过 时 ， 但 我 们 依然 会 问 ， 当 代 是 否 需要 更 多 支柱 ? 我 们 应 该 开 
辟 第 八 根 支柱 吗 ? 如果 管 案 是 “是 ”原因 是 什么 ? 接 下 来 , 我 们 使 用 
一 种 统计 方法 回答 这 个 问题 。 下 面 回顾 数据 ， 看 看 这 七 根 支 柱 是 否 透 
露 了 答案 。 

第 一 根 支柱 一 一 “聚合 "， 本 质 上 在 讲 信息 的 放弃 ,这 是 一 种 “ 创 
造 性 毁灭 ”的 行为 。 这 个 术语 是 约瑟夫 ，' 能 彼 特 提出 的 ， 用 于 描述 一 
种 经 济 重 组 的 形式 ， 是 看 待 这 种 行为 的 一 种 方式 。 正 如 类 似 的 其 他 应 
用 ,“ 聚 合 ”必须 遵守 原则 进行 ， 放弃 不 利于 ( 其 至 可 能 减损 ) 最 终 科 
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学 目标 的 信息 。 不 过 ， 即 便 如 此 ， 它 也 会 受到 指责 : 隐匿 了 其 他 观点 
下 的 个 别 特征 。 而 没有 个 别 特征 将 如 何 开发 “个 人 医疗 信息 系统 ”? 
一 些 统计 问题 会 用 到 “充分 统计 量 ” 的 概念 ， 汇 总 了 损失 无 关 信 息 数 
据 的 变量 。 但 在 大 数据 时 代 , 这 常常 不 可 行 , 或 者 背后 的 假设 不 稳定 。 
因此 ， 要 支持 统计 智慧 ， 必 须 平 衡 这 些 问题 。 

第 二 根 支 柱 一 一 “信息 及 其 测量 ”, 在 统计 中 的 含义 与 在 信号 处 理 
中 的 含义 不 同 。 它 和 聚合 一 起 ， 帮 助 识别 信息 中 的 增益 率 递减 如 何 
同 预期 的 使 用 相 联系 ， 以 及 这 如 何 帮助 设计 实验 和 聚合 两 者 的 形式 。 
信号 处 理 中 , 传递 的 信息 可 以 无 限期 保持 一 个 恒定 速率 ; 而 在 统计 中 ， 
信号 的 信息 累积 率 则 必须 递减 。 看 似 相 等 的 信息 块 在 统计 分 析 中 并 不 
等 价 ， 这 种 现实 依然 矛盾 。 

第 三 根 支柱 一 一 “ 似 然 ”, 使 用 概率 校准 推断 , 并 为 度量 不 确定 性 
提供 尺度 。 和 危险 性 很 高 ， 价 值 也 很 大 ， 要 求 有 极 大 的 细心 和 理解 进行 
明确 运用 ， 但 回报 也 是 丰厚 的 。 其 中 最 简单 的 应 用 是 显著 性 检验 ， 它 
的 误导 性 应 用 已 经 展现 出 来 ， 似 乎 它们 成 了 “诅咒 ” 企 业 的 证 据 ， 而 
不 是 为 了 支持 特殊 用 途 的 证 据 。 过 去 一 个 世纪 中 ， 显 著 性 检验 的 使 用 
不 断 增 长 ， 证 明了 需要 为 支持 或 反对 某 个 命题 而 校准 证 据 。 而 使 用 不 
当时 ， 汇 总 会 产生 误导 ， 但 这 不 该 使 我 们 更 倾向 于 盲目 接受 口头 总 结 
的 误导 ， 因 为 这 种 口头 总 结 甚至 缺乏 对 公认 标准 尝试 校准 的 认同 。 而 
似 然 不 仅 向 我 们 的 结论 提供 了 度量 ， 还 对 分 析 、 聚 合 的 方法 以 及 信息 
积累 的 速率 提供 了 指导 。 

第 四 根 支 柱 一 一 “相互 比较 ”, 给 出 内 部 标准 , 以 及 根据 手边 数据 
判断 内 部 效应 及 其 显著 性 的 一 种 方法 。 它 是 一 把 双 刃 剑 ， 因 为 不 需要 
外 部 标准 会 使 结论 移 除 所 有 相关 性 。 因 此 ， 一 方面 ， 使 用 时 要 小 心 明 
T. 另 一 方面 ， 与 第 六 根 支 柱 “ 设 计 ” 一 起 ， 在 某 些 高 维 情形 下 ， 可 
以 产生 近乎 神奇 的 路 径 ， 通 向 对 问题 的 理解 。 
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第 五 根 支 柱 一 一 “回归 ”, 极其 巧妙 。 对 统计 分 析 而 言 , 它 是 一 种 
相对 性 原则 。 从 不 同 出 发 点 提出 问题 ， 这 种 思想 不 仅 产 生 了 意外 的 洞 
察 力 ， 也 产生 了 框架 性 分 析 的 新 方法 。19 世纪 80 年 代 ， 迟 到 的 发 现 
证 明了 这 种 精妙 。 它 是 使 用 多 元 对 象 的 方式 , 以 一 种 纯正 的 多 元 分 析 ， 
取 其 中 一 部 分 并 重新 组 合 。 基 本 形式 的 逆 概 率 比 较 上 古老 , 但 19 世纪 
80 年 代 前 ,还 没有 机 制 可 以 用 于 进行 一 般 性 描述 推断 ， 特 别 是 贝 叶 斯 
推断 。 早 期 的 尝试 可 以 用 滑翔 机 飞行 来 比喻 。 它 最 多 只 是 在 缓慢 地 下 
KE, 但 在 理想 的 环境 下 ， 它 会 在 某 些 有 限 的 地 带 给 出 飞行 的 错觉 。 随 
着 在 19 世纪 80 年 代 的 发 展 ， 我 们 的 动力 飞行 在 原则 上 可 以 在 所 有 环 
境 中 高 飞 ， 并 且 避 免 了 事故 或 不 可 能 性 。 对 一 些 早 期 探险 家 来 说 ， 这 
已 证 明 为 是 致命 的 。 经 过 20 世纪 的 再 次 充分 发 展 , 这 种 理解 产生 的 新 
方法 可 以 允许 高 度 更 高 甚至 维度 更 高 的 旅行 ， 这 是 更 普通 的 运输 方法 
还 未 达到 的 关键 。 

第 六 根 支柱 一 一 “设计 ”, 也 极其 巧妙 。 构 造 结构 模型 ， 可 以 对 同 
时 考虑 多 个 因素 的 高 维 数据 模型 进行 探索 。 通 过 基础 推断 生成 的 随机 
化 ， 可 以 只 依赖 于 最 低 程度 的 建 模 。 

最 后 一 根 支柱 一 一 “ 残 差 ”, 将 复杂 模型 的 比较 逻辑 作为 探索 高 维 
数据 的 途径 ， 图 分 析 中 也 使 用 了 同样 的 科学 逻辑 。 现 在 ， 这 是 我 们 面 
对 的 最 大 需求 。 数 百年 之 后 ， 我 们 面临 的 问题 依然 存在 ， 最 不 可 能 提 
供 广泛 的 解答 。 在 这 里 ， 我 们 或 许 看 到 了 对 第 八 根 支柱 的 潜在 需求 。 

现在 ， 数 据 集 越 来 越 大 ， 待 解答 的 问题 和 焦虑 也 越 来 越 多 ， 人 们 
担心 现代 计算 中 国有 的 灵活 性 将 会 超过 答案 确定 性 的 校准 和 判定 能 
力 。 如 果 我 们 可 以 把 注意 力 限于 少数 备 选 的 或 结构 良好 的 参数 化 模型 ， 
就 能 舒 舒服 服 地 待 在 家 里 。 但 许多 情况 下 ， 这 种 舒适 正在 消失 ， 或 
者 成 为 泡影 。 例 如 ， 考 虑 这 样 三 类 问题 : (1) 大 数据 的 预测 或 者 分 类 器 
的 公式 化 ， 数 据 与 许多 观测 样 例 有 关 ， 每 种 情况 有 许多 维度 的 测量 ; 
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(2) 大 型 的 多 重 比 较 问 题 ; (G3) 关注 的 问题 至 少 部 分 是 科学 研究 最 后 阶段 
中 的 探索 性 分 析 。 

我 们 面临 的 第 一 个 问题 是 任何 高 维 探索 都 必然 面 对 的 。 假 定 现在 
需要 根据 20 个 特征 构建 某 种 测量 的 一 个 响应 预测 。20 维 的 空间 有 多 
K? 如 果 将 每 个 预测 变量 的 范围 划分 成 四 分 位 数 ，20 维 空间 就 被 划分 
为 42 个 不 同 的 部 分 。 如 果 有 10 亿 个 观测 样 例 , 平均 每 1000 个 部 分 才 
会 有 一 个 样 例 。 这 个 经 验 基 础 几乎 不 可 能 建立 置信 和 度 ! 因此 ， 任 何 合 
理 的 分 析 必 须 ( 哪怕 只 是 含蓄 的 ) 做 出 高 度 限 制 的 假设 : 或 是 通过 一 
个 低 维 的 参数 模型 ， 或 至 少 假设 数据 接近 某 个 低 维 子 空间 。 在 这 样 的 
假设 下 ， 机 器 学 习 领 域 的 许多 优秀 算法 已 经 设计 出 来 。 通 常 ， 优 秀 的 
算法 在 某 些 情况 下 受到 了 成 功 应 用 的 有 限 支 持 ， 但 几乎 没有 善 遍 适 用 
的 证 据 。 其 中 一 种 情况 是 所 谓 的 “支持 向 量 机 ”， 统 计 学 家 格 董 丝 ， 
沃 赫 拜 曾 表示 ， 可 以 将 其 视 为 近似 特定 的 贝 叶 斯 处 理 。 通 过 揭示 为 什 
么 以 及 何 时 会 这 么 好 ， 极 大 地 增加 其 扩展 知识 ， 但 一 般 性 的 问题 依然 
非常 困难 。 

第 二 类 问题 多 重 比较 中 ,我 们 面临 的 是 需要 进行 数目 庞大 的 检验 。 
方差 分 析 中 ， 通 过 用 大 量 成 对 比较 的 置信 区 间 ， 比 较 许多 个 因子 的 效 
应 。 基因 组 学 研究 中 , 数 千 个 点 位 分 别 放 到 彼此 不 独立 的 假设 检验 中 。 
概率 校准 ， 即 置信 区 间或 显著 性 检验 ， 对 只 有 一 对 或 一 个 样 例 的 情况 
是 有 效 的 ; 但 在 50 万 个 样 例 的 更 极端 的 值 中 选择 样 例 时 ， 它 们 就 没 
那么 有 用 了 。 即 使 在 20 世纪 60 年 代 ， 大 家 就 已 经 知道 ，W. RAF 
I - 谢 弗 所 设计 的 过 程 ， 通 过 弱化 结果 的 陈述 ， 对 上 面 所 说 的 选择 
做 了 补偿 。 它 和 更 大 的 置信 区 间 一 样 ， 并 非 完整 的 答案 。1965 年 ， 大 
T. « 考 克 斯 看 到 了 困难 的 一 部 分 : 对 大 量 陈述 同时 成 立 的 正确 性 计算 
一 个 概率 事实 ， 通 常 并 不 能 保证 这 个 概率 与 其 中 一 个 陈述 的 不 确定 性 
的 度量 相关 。 考 克 斯 注意 到 ( 比如 根据 图 基 或 者 谢 弗 的 )， 整 体 修正 
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并 不 以 手边 数据 的 特殊 性 作为 条 件 ， 而 这 或 许 是 因为 太保 守 了 。 更 现 
代 的 概念 一 一 比如 错误 发 现 率 一 一 正 处 在 发 展 阶段 ,但 问题 依然 困难 。 

第 三 类 问题 的 焦点 问题 出 现在 分 析 后 期 , 与 第 一 、 二 类 问题 有 关 ， 
但 更 加 一 般 化 。 即使 在 小 数据 的 问题 上 , 可 以 使 用 的 解决 途径 也 很 多 。 
但 途径 如 此 之 多 一 一 其 至 从 某 种 角度 看 一 一 事实 上 处 于 一 种 大 数据 的 
窘境 。 早 在 1885 年 ， 阿 尔 弗 雷 德 . 马 软 尔 就 意识 到 了 这 一 点 ， 他 写 
道 :“ 所 有 理论 家 中 , 最 鲁 闫 和 狭 诈 的 是 那些 自称 让 事实 和 数字 为 他 们 
说 话 的 人 。 这 些 人 他 在 幕后 扮演 着 自己 的 角色 ， 有 意 无 意 地 对 事实 和 
数字 进行 选择 和 重组 ， 并 提出 ”后 发 者 因 之 而 发 ”的 观点 。” 安德鲁 ， 
格 尔 曼 从 路 易 斯 ， 博 尔 赫 斯 1941 年 的 小 说 标题 中 借用 了 一 个 合适 的 
术语 描述 这 个 问题 一 一 小 径 分 又 的 花园 。 一 个 结论 经 过 的 曲折 、 涉 及 
许多 选择 ( 关于 数据 、 方 向 、 问 题 类 型 ) 后 被 合理 确定 时 ,没有 考虑 
最 终 的 显著 性 评价 。 通 常 ， 大 数据 就 是 这 样 的 花园 。 在 花园 的 每 个 分 
又 所 关注 的 问题 上 ,我们 的 校准 依然 有 用 ， 但 它们 能 成 功 转移 到 外 部 
的 观点 吗 ? 

我 已 经 确认 了 第 八 根 支柱 的 位 置 ， 但 没 说 它 是 什么 。 它 是 一 个 领 
Ah, 其 中 大 量 过 程 结合 着 对 某 些 特定 科学 问题 的 部 分 回答 ， 已 经 得 到 
发 展 。 这 根 支 柱 可 能 存在 ， 但 没有 整体 结构 ， 还 没有 获得 需要 的 普遍 
认同 以 确立 其 存在 。 历 史 表 明 ， 这 种 普遍 认同 不 会 轻易 出 现 ， 或 者 不 
会 一 步 到 位 。 每 种 有 生命 力 的 科学 都 有 它 自 身 的 奥秘 : 天 文学 是 暗 能 
量 和 暗物质， 物理 学 是 弦 理 论 和 量子 理论 ， 计算机 科学 是 P-NP 难题 ， 
数学 是 黎 曼 假设 。 甚 至 对 于 最 困难 的 情形 ， 现 存 的 七 根 支 柱 也 能 文 持 
至 少 部 分 的 回答 。 统 计 是 一 门 活跃 的 科学 ， 这 七 根 支 柱 提供 了 强大 的 
支持 。 我 们 进入 了 一 个 充满 挑战 性 的 时 代 ， 与 我 们 相伴 的 是 其 他 领域 
的 强大 盟友 以 及 胜任 挑战 的 强烈 期 望 。 
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